2017-06-13 50 views
0

我真的很陌生,我一直試圖模擬從Python的「pandas.read_table」代碼,用於數據分析的書(關於MovieLens 1M數據集的章節, pg.23ish)。下面是用於數據庫的文件的鏈接以及我輸入代碼的jupyter筆記本的圖像。正如你將會看到的那樣,我遇到了數據值不正確的問題,因爲它應該這樣,我似乎無法弄清楚爲什麼。您的幫助將非常感謝!在讀熊貓表的時候遇到了麻煩

Trouble screen

Database file

回答

1

如果您是從.csv文件中讀取數據,使用pd.read_csv

如果要使用pd.read_table,則必須使用參數sep=','指定分隔符作爲逗號。發生了什麼事情是pd.read_table試圖在每個::處分隔輸入信息,但看起來您的數據是用逗號分隔的。

點擊此處瞭解詳情:

http://pandas.pydata.org/pandas-docs/stable/io.html

https://pandas.pydata.org/pandas-docs/stable/generated/pandas.read_table.html

+0

這是你的答案! – piRSquared

+0

啊哈!非常感謝! :) –