我有一個輸入文件,我想讀入一個熊貓數據框。 該文件是空格分隔的,包括第一個值之前的空格。 我已經嘗試使用「\ W +」正則表達式作爲分隔符的read_csv和read_table。 W +分隔符意外的read_csv結果
data = pd.io.parsers.read_csv('file.txt',names=header,sep="\W+")
他們在正確的列數讀,但值本身是完全僞造的。是否有其他人遇到過這種情況,或者我使用不正確
我也嘗試逐行讀取文件,從row.split()
創建一系列並將該系列附加到數據幀,但它似乎因內存而崩潰。
是否有任何其他選項用於從文件創建數據框?
我使用熊貓v0.11.0,Python 2.7版
我的錯誤與\ W。 \ s +和delim_whitespace都可以工作。文檔似乎表明delim_whitespace提供更好的性能。 再次感謝:) – taylormade201