2013-08-04 23 views
1

我想在使用Apache Solr對數據建立索引時使用NLP。如何通過Apache solr和LingPipe或類似工具使用實體識別

  1. 確定單詞和索引的同義詞也。

  2. 確定命名實體並在索引時對其進行標記。

  3. 當有人查詢Solr的指數,我應該能提取從查詢 命名實體和意圖,形成查詢字符串, 以便它可以有效地搜索索引文件。

是否有任何工具/插件可用來滿足我的要求?我認爲這是大多數基於內容的網站的常見用例。人們如何處理它?

回答

2

退房Apache UIMA

特別是,如果你需要的Solr做命名實體識別,你可以用UIMA使用SolrUIMA

看看這個talk,演示UIMA + Solr的集成。

相關問題