2014-02-07 71 views
0

我目前正在嘗試使Solr索引很多庫數據。例如,這個圖書館數據包含着不同的拼寫方式,以及當地字母(如ä,ü,ø,ö等)。我希望它可以讓我的用戶搜索Østersøen並獲得結果,如Österssöen, ØstersøenSolr - 使字符搜索幾個其他

我的問題是,我該如何使用Solr實現這一目標。在我看來,映射不會削減它,因爲我想一個字符能夠算作其他幾個。

u -> u, ü, ù, ú 
å -> å, aa 
ø -> ø, ö, o 

周圍的其他方法(其中一些),這樣

aa -> å 

這是可能的,如果是的話怎麼辦?

回答

1

看提示here。基本上有兩兩件事要做:

  1. 適當詞幹/過濾器根據語言
  2. ASCIIFoldingFilterFactory/ICUFoldingFilterFactory
0

你想的Unicode摺疊(ICUFoldingFilterFactory),其完成所有的正常化。

您也想通過與the whole 12 post series on the using Solr in the library CJK問題作爲重點閱讀。它可能會回答你甚至還沒有的問題。最後,如果你還沒有看過Project Blacklight,這是值得的。這是一個專門爲圖書館使用Solr的人羣,他們可能有共同的問題和解決方案。