2013-02-14 36 views
2

我是weka中的新成員,我必須從社交網絡中提取狀態並使用weka分析它們,如何構建包含這些狀態的arff文件? weka是否包含詞幹,停用詞和n-gramm的算法,或者我還想使用其他軟件來在開始分類之前消除不必要的數據?併爲weka爲Android和Java的實用工具,有沒有在這個軟件的使用有所不同...有任何想法的傢伙如何爲weka創建一個arff文件?

回答

0

你不應該擔心您的數據爲arff文件,因爲Weka的支持其它輸入格式。您可以簡單地將您的數據作爲csv文件並導入到Weka。如果需要,您可以將其從Weka導出爲arff

Weka有一個端口可以安卓,你可以download here,我確實在我的項目中沒有任何問題地使用它。您可以在PC中訓練您的模型並導出它,然後在android see my answer here中使用它作爲示例代碼。

是,Weka的支持Stemmer algorithms

+0

你能幫我從android文件中提取推文,連接android和weka,並確定將它們放在csv文件中的幾個屬性,我不知道如何開始...有你的例子或一個關注它的教程 – 2013-02-14 11:54:36

+0

您有構建android應用程序的經驗嗎?你的培訓文件是怎樣的?你正在努力達成什麼任務? – iTech 2013-02-14 12:10:37

+0

我將描述這個過程,用戶必須通過android連接到twitter,他選擇一個朋友並提取他的狀態,我收集幾個狀態並將它們放在數據庫中或直接放在一個arff或csv文件中,我將weka連接到並通過WEKA通過不同的算法(停用詞,詞幹,n-gramm,原生貝葉斯和svm)對這些狀態進行情緒分析,以確定其正面或負面情緒,我該如何開始。謝謝 – 2013-02-14 12:27:45

0

我不知道面書,但你可以通過使用arff文件here至於如何創建它們,網上有數百個教程:查看this one並查看它是否對您有所幫助。

希望這有助於

雷切爾

+0

我假設我會從Twitter獲取數據,我是否會使用Android獲得的狀態,然後把它們在數據的基礎上,在那之後,我該怎麼處理如何獲得它?我可以使用android配置weka,或者在從數據bse中提取後構建arff文件?只是一個問題:)在arff文件中的每個狀態末尾寫入pos和neg,哪個軟件可以給我這些結果,以及在使用weka之前我必須處理哪些算法(詞幹,停用詞,特徵) m很困惑,我必須儘快完成這個項目,謝謝你的幫助:) – 2013-02-14 08:59:52

+0

去這個地址它有示例源代碼的詞幹,停用詞等請接受我的回答http://massapi.com/ class/weka/core/stemmers/Stemmer.java.html – 2013-02-14 09:04:39

+0

@ManelAyadi懸停在答案旁邊,你會看到一個勾號出現。點擊它。 – 2013-02-14 09:12:52