0
我是新來的彈性搜索。我無法理解文檔中字段的提升值的校準和縮放比例。正如我們應該如何決定領域的提升值,以便它按預期工作。我已經瀏覽了一些在線博客和文檔,寫道es會對值的提升進行規範化和內部優化?這是如何運作的?促進工作的規範化和內部優化如何進行?這又是如何影響相關性的?
例如:如果我們的文檔中有標籤,標題,名稱和文本字段,我們應該如何確定這些值的提升值?
我是新來的彈性搜索。我無法理解文檔中字段的提升值的校準和縮放比例。正如我們應該如何決定領域的提升值,以便它按預期工作。我已經瀏覽了一些在線博客和文檔,寫道es會對值的提升進行規範化和內部優化?這是如何運作的?促進工作的規範化和內部優化如何進行?這又是如何影響相關性的?
例如:如果我們的文檔中有標籤,標題,名稱和文本字段,我們應該如何確定這些值的提升值?
Elasticsearch使用布爾模型來匹配文檔,然後使用評分模型來確定相關性(即排名)。評分模型使用TF/IDF評分,並結合一些附加功能。這些TF/IDF分數是針對查詢內的每個匹配字段計算的,然後彙總得出文檔的總體分數。爲了深入研究這個過程,我建議您在查詢上運行explain,以查看每個字段的分數是如何影響文檔的整體相關性的。
作爲您數據的專家,您處於確定哪些字段最能影響文檔相關性的最佳位置。找到一個領域的正確提升值是關於調整槓桿,直到找到最符合您期望結果的公式(另外,如果您有用戶,A/B測試可以幫助您)。