2017-04-03 106 views
0

我無法使用weka加載csv文件,我甚至使用文本編輯器刪除了每個特殊符號,但仍然沒有運氣。我附上了這個文件,如果能解決這個問題,我將不勝感激。無法在weka中加載CSV文件

它顯示「值數目錯誤,閱讀31,預期27,閱讀令牌[EOL],3號線」

鏈接:https://drive.google.com/open?id=0By7zyIPDD6HJMmthWnZLSUk5aFE

+0

請編輯你的文章,包括你正在使用的代碼不要我們下載文件 –

+0

沒有代碼,我只是想使用Weka界面加載csv文件,並且上面的鏈接是用於csv文件的。 –

回答

0

您的文件,如果你空字段的普朗蒂將它下載爲.csv,即使頭文件在其結尾處也會得到三個逗號。 例如你的第六行:

,道格·沃克,,, 131,羅布·沃克,131,,紀錄片,道格·沃克,星球大戰:七的部隊醒來時,8,143,0 ,,,,,,, ,, 12,7.1,,0 ,,,

類似於這篇文章中的建議,你可以試試s.th.像記事本++或另一個文本編輯器,用「,?」替換「,,」以填補您的空白。

Convert NA values to ? automatically while loading

我這樣做,然後你在第一排兩個問號得到列名至極顯然行不通,所以改變的第一行是這樣的:

顏色,director_name ,num_critic_for_reviews,持續時間,director_facebook_likes,actor_3_facebook_likes,actor_2_name,actor_1_facebook_likes,毛,流派,ACTOR_1_NAME,MOVIE_TITLE,num_voted_users,cast_total_facebook_likes,actor_3_name,facenumber_in_poster,plot_keywords,?,num_user_for_reviews,語言,國家,CONTENT_RATING,預算,TITLE_YEAR,actor_2_facebook_likes,imdb_score,ASPECT_RATIO ,movie_faceb ook_likes,additionalColName1,additionalColName2,additionalColName3

,如果你現在嘗試導入數據秧雞開始告訴你該行不喜歡的原因。順便說一句。你沒有「刪除每一個特殊符號」! 用例如它的工作原理。

這只是一個醜陋的解決方法,嘗試填充空值,並找到一個正則表達式或更好的方式來保存您的文件,以刪除每行的最後三個逗號,我現在只是太懶了。但我可以將它加載到weka,這就是你想要的(

+0

感謝隊友!它工作:) –

+0

不客氣;) –