我正在尋找一個文本分析和提取實體的庫。實體提取庫
實體的類型/分類並不重要,它是識別值得關注的事物。這種情況下的實體宇宙是無限的,它不受固定字典限制。
似乎有幾個Web服務可以做到這一點(NERD讓你比較這些Web服務的結果:http://nerd.eurecom.fr/documentation這是非常有用的),但我正在尋找一個本地庫,而不是遠程託管服務。我更喜歡Java或.NET,但如果它是一個好的庫,我將學習它寫入的任何語言。
在類似主題上很少有舊線程,我希望能夠在這個領域找到新的發展, /或庫建立在較低的水平NLP庫的頂部:
- Entity Extraction/Recognition with free tools while feeding Lucene Index
- Lucene Entity Extraction
- How do I do Entity Extraction in Lucene
- https://stackoverflow.com/questions/tagged/named-entity-extraction
- https://stackoverflow.com/questions/tagged/named-entity-recognition
有沒有人知道一個好的圖書館,做一個體面的工作?
更新了問題以突出顯示我在尋找本地圖書館而不是遠程託管服務。 – hi1869695