我有一個很大的問題和有關solr行爲的問題,請你幫我解決這個問題。Solr中的準確字母匹配與文本字段的單個/多個字
不介意我的問題太長了。
我的客戶有如下要求。
- 我們需要一個matchall和matchallpartial場景。
- 這取決於我們在應用程序級別執行matchall或matchallpartial的搜索字段。
我們也有通配符,左邊和右邊都是通配符條目。
我使用關鍵詞標記器進行索引以及查詢它是滿足我在所有情況下的需求。但同義詞,停用詞和詞幹根本不工作。因爲我使用關鍵詞標記器,它正在構建整個短語的查詢。我試過與StandaradTokenizer工廠它僅失敗matchall情況下,它仍然工作正常。
請問您可以發佈一些示例查詢和建議,以獲得與單個單詞/多字的精確匹配。
例如 如果我的領域有 「指標指標組件」這是整個短語。即使我正在尋找「指標」我不想要的結果即將獲得結果。
如果我使用關鍵詞tokenizer,我得到了我想要的但它在同義詞,停用詞方案中失敗。
有些時候(取決於邏輯)我將使用matchallpartial場景的相同文本提交時間,我希望「indicator」的結果如何通過stadardtokenizer獲得整個短語/單詞的準確matchall。
請幫幫我。
感謝, 斯里蘭卡
不要忘記你可以索引多次相同的字段與不同的標記化;您可以使用查詢部分匹配的標記化版本,以及查詢完整匹配的更確切版本。 – Yann 2015-02-09 15:23:24
Yann如何在不同的領域使用不同的標記器。 – 2015-02-19 14:59:28
是的,您可以在您的模式中定義各種fieldTypes;通常爲了完全匹配,您將使用KeywordTokenizerFactory(實際上不實際標記),對於部分匹配,則使用StandardTokenizerFactory。您可以在兩個字段(每個字段都有一個字段)中編制相同的內容,並根據您想要的匹配類型,查詢或其他字段進行索引。 – Yann 2015-02-19 15:15:08