2016-08-24 17 views
0

我想插入大尺寸的csv文件到Weka中進行特徵選擇。 csv文件大小約爲2.3GB,它包含41行2000,002列。我如何解決weka上的這個錯誤?

第一行包含 (sample_id)(1〜200萬)(類)

和從第二線 ID浮球浮子...類(Y/N)

然而當嘗試將此文件插入weka,彈出錯誤消息:

weka.core.coverters.CSVLoader未能加載'test.csv'。原因:錯誤 數值。閱讀1000002,預計100001,讀令牌[EOL]線 遇到的第2行問題:2

我不知道爲什麼這個錯誤出來..

回答

0

這個錯誤只是試圖告訴你輸入i中的某行不是由2000002(指定的)列組成。只需檢查指定的錯誤行或其周圍的行,看它們是否包含正確的列數。它應該解決你的問題。

由於列(特徵)的數量太大,所以只需計算逗號(如果您的輸入爲逗號分隔)的數目,則按Ctrl + f即可。有了這個,你可以找到該行中沒有列。

希望它有幫助!

0

檢查您的數據集缺失值。我曾經遇到過這個錯誤,並且發現我的數據集中缺少值。