2012-04-18 52 views
0

我有一個同義詞文件,在索引時間使用,包含此等價:Solr中,擴大多字同義詞和長期職位

uc, university of california 

我又看了看如何索引「加州大學伯克利分校」將眼光放在analysis.jsp。我很驚訝:

org.apache.solr.analysis.SynonymFilterFactory {synonyms=companysyns.txt, expand=true, ignoreCase=true, luceneMatchVersion=LUCENE_36} 
position 1    2    3 
term text university  berkeley  california 
      uc    of 
type  SYNONYM   word   SYNONYM 
      SYNONYM   SYNONYM 
startOffset 0    3    3 
      0    3 
endOffset 2    11    11 
      2    11 

請注意,「伯克利」出現在「大學」和「加州」之間。這意味着,當我搜索「加州大學伯克利分校」時,我沒有得到一場比賽。但「伯克利大學加利福尼亞州」的作品!

我怎樣才能確定「加州伯克利大學」能正常工作?

謝謝!

回答

0

我正面臨類似的問題,突出顯示的響應中突出顯示了錯誤的單詞。我正在使用solr 3.6

在我的用例中,在索引側配置了同義詞,其中expand = true。

例如,如果我有在synonyms.txt, DNS,域名系統

和I指數類似「樣本DNS條目的作品」以下。當我在突出顯示的響應中搜索「名稱」(不含引號)時,我會看到「樣本dns 條目有效」。正如你所看到的單詞條目突出顯示。
同時適用於 「A樣本DNS條目作品」

0

「系統」 結果的搜索看起來像一個已知problem。提到了一個修復(將luceneMatchVersion設置爲LUCENE_33)。不知道它是否適合你。希望他們儘快修復。