我的工作是計劃使用UIMA集羣來運行文檔以提取命名實體,而不是。據我所知,UIMA幾乎沒有與它一起打包的NLP組件。我一直在測試GATE一段時間,並且對它很滿意。它在正常文本上沒問題,但是當我們通過一些有代表性的測試數據運行它時,精度會下降。我們內部的文本數據有時全部大寫,有時全部小寫,或者在同一文檔中混合使用。即使使用ANNIE的所有上限規則,準確性仍有很多不足之處。我最近聽說過斯坦福大學的NLP和OpenNLP,但還沒有時間進行廣泛的培訓和測試。這兩者如何與ANNIE的準確性進行比較?他們是否像GATE一樣與UIMA一起工作?準確性:ANNIE對比斯坦福NLP vs UIMA對OpenNLP
在此先感謝。
ANNIE是基於規則的。我的猜測是斯坦福NLP和OpenNLP應該表現更好,因爲它們是基於ML的。 – 2013-04-09 10:02:53