2017-07-29 36 views
0

我使用Apache Lucene的6.3.0,我想用2個分析儀指數我的領域「FILE_NAME」:
1. StandardAnalyzer(允許使用的搜索術語)
2 。KeywordAnalyzer(保留原始名稱,以防萬一用戶搜索整個名稱)使用在同一領域的多個分析儀 - Apache的Lucene的

請注意,這可以通過使用搜索時間輸入分析來實現,但我希望避免在搜索前端增加複雜性我的應用程序

回答

0

你不能,所以你要麼必須:

  • 有不同的處理兩個字段,並使用copyField索引相同的內容在兩個字段中,但過程不同的看法(這是很有用也得分命中精確比那些已被StandardTokenizer處理)
  • 使用KeywordTokenizer together with a WordDelimiter(Graph)Filter更高,並設置preserveOriginal爲true。

第一個將允許您以不同方式區分字段的優先級,但在查詢時將要求您包含這兩個字段。後者將在單個字段中包含所有數據,但不會讓您對它們進行不同的評分。