5

我正在尋找一個文本分析和提取實體的庫。實體提取庫

實體的類型/分類並不重要,它是識別值得關注的事物。這種情況下的實體宇宙是無限的,它不受固定字典限制。

似乎有幾個Web服務可以做到這一點(NERD讓你比較這些Web服務的結果:http://nerd.eurecom.fr/documentation這是非常有用的),但我正在尋找一個本地庫,而不是遠程託管服務。我更喜歡Java或.NET,但如果它是一個好的庫,我將學習它寫入的任何語言。

在類似主題上很少有舊線程,我希望能夠在這個領域找到新的發展, /或庫建立在較低的水平NLP庫的頂部:

有沒有人知道一個好的圖書館,做一個體面的工作?

回答

0

你可以使用NLTK和Python。有關使用NLTK執行NER的示例,請參閱this question