2017-10-10 115 views
1

我有一個關於分析文檔的問題。 使用Apache Tika,可以創建不同類型的不同文件的內容和元數據。Apache Tika與Apache Lucene

是否有可能用Tika獲得文件關鍵字(詞幹)還是我仍然需要Lucene的呢?

回答

0

我不知道是否有可能,但我會建議在lucene中進行所有關鍵字分析。我個人的原因:

  • Tika的主要目的是提取信息出文件
  • Lucenes的定義數據將如何進行分析和索引。怎樣的數據進行分析,對如何(你希望找到的東西找到)中搜索您的Lucene索引performes
  • 它是一種擔心提卡只提取和Lucene關心搜索分離的相關事物
大的影響