0

我想開發一個非常簡單的程序,用於使用各種算法對文檔進行分類和分類。我的問題,因爲我是一個初學者,是我無法找到好的文章或網站的簡單教程如何開始使用它。我讀了很少的資源,我學到了很多東西,但每個文檔,網站等我讀它使用不同的技術,它以不同的方式分析問題,提出不同的解決方案等,所以我感到困惑。是否有任何好的資源可以讓我指出,以便開始實際實施?文本分類分類指針

此外,我正在尋找實際的測試數據和具體的文件分類,所以我可以「喂」我的算法。任何幫助讚賞。謝謝。

+0

如果你在Java中編程,那麼這個[SO問題](http://stackoverflow.com/questions/2821575/java-text-classification-problem)可能對你很有幫助 – GETah

回答

1

對於Python,請查看scikit-learn tutorial on text classification。另請參閱其demo script,該文件在twenty newsgroups基準數據集上運行數十種不同的文本分類算法(包括樸素貝葉斯和SVM)。 [免責聲明:我合着了這些東西。]

對於Weka,這裏是tutorial

+0

謝謝我目前正在尋找數據集,這是非常有用的,但由於我在Java程序中的python示例似乎很混亂。對於我以前試過的WEKA,但它實際上並沒有正確的文檔。 WEKA的教程是一個但有限的不多說。你知道任何其他的Java方法或指針嗎?感謝您的迴應。 –