2010-11-22 129 views
4

請建議一個好的機器學習分類器,用於數據集的真實分類。 另外,是否有可能在這樣的分類器中指定自己的規則/特徵來進行歸類?感謝您的所有建議。自然語言處理 - Truecaser分類器

謝謝

回答

3

我在Python中實現了一個版本的truecaser。當你提供足夠的數據(即正確的句子)時,它可以訓練任何語言。

對於英語,它對維基百科的樣本句子的準確率達到98.38%。提供了預先訓練的英語模型。

你可以在這裏找到: https://github.com/nreimers/truecaser

+0

鼓勵與外部資源的鏈接,但請在鏈接上添加上下文,以便您的同行用戶瞭解它是什麼以及它爲什麼在那裏。如果目標網站無法訪問或永久離線,請始終引用重要鏈接中最相關的部分。從[如何回答](http://stackoverflow.com/help/how-to-answer)。 – 2016-06-09 14:15:45