2013-09-23 66 views
0

文件到大熊貓數據幀,並建立日期時間指數我有一個CSV文件中像這樣:讀CSV從多個列

2011 1 10 1000000 
2011 1 11 998785 
2011 1 12 1002940 
2011 1 13 1004815 
2011 1 14 1009415 
2011 1 18 1011935 

我想把它讀入數據幀對象,並具有內置日期時間類型的指數第一個3 colomns。最終的DataFrame應該如下所示:

     values 
datetime(2011,1,10) 1000000 
datetime(2011,1,11) 998785 
... 

我應該怎麼做?非常感謝!

回答

3
import io 
import pandas as pd 
content = io.BytesIO('''\ 
2011 1 10 1000000 
2011 1 11 998785 
2011 1 12 1002940 
2011 1 13 1004815 
2011 1 14 1009415 
2011 1 18 1011935''') 

df = pd.read_table(content, sep='\s+', parse_dates=[[0,1,2]], header=None) 
df.columns=['date', 'values'] 
print(df) 

產生

    date values 
0 2011-01-10 00:00:00 1000000 
1 2011-01-11 00:00:00 998785 
2 2011-01-12 00:00:00 1002940 
3 2011-01-13 00:00:00 1004815 
4 2011-01-14 00:00:00 1009415 
5 2011-01-18 00:00:00 1011935 
+0

謝謝。我得到錯誤如:「例外:長度不匹配(2對4)」。我假設列數不正確。是否有一個版本與熊貓不匹配? – xiaolong

+0

用熊貓完美地工作0.11.0 –

+1

我懷疑這是一個版本問題;更有可能有像「日期值」這樣的標題行,您應該跳過。 –