我正在使用Python和Facebook-SDK收集來自Facebook頁面的所有評論。保存使用Python從Facebook收集的評論的最佳方式是什麼?
由於我想對這些評論進行情緒分析,保存這些文本的最佳方式是什麼,這樣就不需要對文本進行任何更改?
我現在將註釋保存爲表格,然後保存爲CSV文件。
table.to_csv('file-name.csv')
但是,如果我想讀這個保存的文件,我得到以下錯誤:
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xfc in position ...
順便說一句,我與德國文本工作。
幾個問題。 1)你想要存儲多少數據? 2)你是否正在考慮實施某種數據庫來存儲它們? 3)是否有任何理由不應該只是使用csv文件,儘管看起來像是一個簡單的修復錯誤? – SAMO
感謝@NelsCarlson的快速回復。 1)目前,我不能完全說,因爲想象一下,我想收集大概50頁的所有信息,然後根據信息過濾我需要的信息,最後爲每個選定信息的所有信息。 2)否,例如,對於註釋,我定義了一個函數和一個空列表>> emptyList.append(..)。 3)不,對我來說,重要的是我不會失去任何東西,並且簡單地檢索用於進行情緒分析的文本。 – Vahid
好吧,因爲你存儲的數據看起來很相關(你找到一篇文章,然後所有與帖子相關的消息),我會推薦一個JSON對象。它只會像CSV一樣保存到您的計算機上,但結構可能會讓事情變得更簡單。像{'post_id':001''message':'hello'}可能會使預成形操作變得更簡單。 – SAMO