2012-08-07 50 views
9

我正在對NLP應用程序的不同庫和系統進行調查。我正在尋找我錯過的那些。我從頭開始的名單不斷增長,所以我確信還有更多。這是我迄今發現的。什麼庫提供基本或高級的NLP方法?

他們有些是開源的,有些是不。每個人都有權衡。我認爲我傾向於圖書館,讓我更多地使用基本的NLP功能(例如,我想看看實際的POS標籤)。

那麼我錯過了什麼?你在用什麼或你喜歡什麼?謝謝!

+0

感謝unutbu的URL鏈接。我應該增加更多,因爲它們對每個人都是通用的。 – 2012-08-07 17:40:12

+0

我聽說GitHub上有一個NLTK 3.0分支,但現在已經不存在了。對此有何評論?我在很多項目上使用了NLTK 2,但在將它移植到Python 3之後還遠遠不夠。除了實驗之外,我不能推薦它。 – 2012-08-07 21:44:32

+0

http://text-processing.com/ – alvas 2014-03-05 15:48:51

回答

4

一些更多:

此外,檢查此Wikipedia文章:List of natural language processing toolkits

+0

該維基百科文章是通往各種其他東西的門戶。對此,我真的非常感激。 Apache UIMA是一個非常好看的框架,特別是因爲有明確的方法可以使它與Hadoop一起工作。 – 2012-08-08 22:45:53

1

另外一個是一個可恥的思念是LinguaSys哪一個我的朋友Meta Brown正在努力!

1

Apache UIMA是我第一遍錯過的另一篇文章,在維基百科的文章中。這是非常好的,有一個OASIS認證和十億有用的工具。我不知道合作有多難。看起來我會被拖拽並尖叫回Java編程。在它與斯坦福和LingPipe之間,我在開源世界看到了很多偉大的選擇。

1

如果你喜歡UIMA,那麼你會發現ClearTK非常有用。它通過UIMA實現,併爲許多NLP/ML庫(OpenNLP,Stanford NLP,Mallet,LibSVM等)提供了包裝器。它還具有很好的文檔分類,POS標記,命名實體識別等示例。

相關問題