我有一個關於讀取csv文件的位和塊的問題。如果只是閱讀使用使用熊貓在Python中讀取csv文件塊
pd.read_csv(path,sep=';',na_values=[''],thousands='.',decimal=',',date_parser=[0])
文件獲得:
EUR 1Y 2Y 3Y
0 2013-09-25 0,198 0,307 0,485
1 2013-09-26 0,204 0,318 0,497
2 2013-09-27 0,204 0,306 0,487
3 2013-09-28 0,204 0,306 0,487
4 USD 1Y 2Y 3Y
5 2013-09-25 0,462 0,571 0,749
6 2013-09-26 0,468 0,582 0,761
7 2013-09-27 0,468 0,57 0,751
8 2013-09-28 0,468 0,57 0,751
正如你所看到的,數據排列日期明智的,並且每個數據集是一前一後的塊(在這種情況下,美元數據是在歐元數據之後)。貨幣標籤稍微隱藏了一些東西,數據變成了一個單一的數據框。
我想什麼有兩個單獨的數據幀,
EUR 1Y 2Y 3Y
0 2013-09-25 0,198 0,307 0,485
1 2013-09-26 0,204 0,318 0,497
2 2013-09-27 0,204 0,306 0,487
3 2013-09-28 0,204 0,306 0,487
USD 1Y 2Y 3Y
0 2013-09-25 0,462 0,571 0,749
1 2013-09-26 0,468 0,582 0,761
2 2013-09-27 0,468 0,57 0,751
3 2013-09-28 0,468 0,57 0,751
也就是說,我想每個貨幣數據彼此獨立設置。
有什麼建議嗎?
真的很不錯的解決方案。實際上,我更需要內聯,因爲我最終需要將所有內容都轉換爲Excel數據透視表(因此貨幣列使事情變得更容易)。我只能得到()和[ ]作爲'mask'的輸出... – gussilago
使用mask = data ['date']。str.CONTAINS('^ \ s * \ D')來代替MATCH來解決它。再次感謝@unutbu – gussilago