1
在我的文檔中,我有一個名爲Tag和SuperTag的字段。每當標籤匹配時它會提高一些分數,但是如果在SuperTag上匹配,它將顯着提高以使其成爲第一選擇。在你看來,我應該爲Tag和SuperTag增加什麼樣的價值?謝謝。我應該把什麼分數放在elasticsearch的增強字段
在我的文檔中,我有一個名爲Tag和SuperTag的字段。每當標籤匹配時它會提高一些分數,但是如果在SuperTag上匹配,它將顯着提高以使其成爲第一選擇。在你看來,我應該爲Tag和SuperTag增加什麼樣的價值?謝謝。我應該把什麼分數放在elasticsearch的增強字段
這是很難回答的問題,它非常依賴於現場包含的數據和他們擁有的分析儀。
顯然,如果數據將幾乎相同,我會設置一個在超級領域的提升到2.0
。
萬一他們不持有相同的數據,我們能想象的場景是這樣的:
{tag: 'tagnice tagnice tagnice'}
{supertag: 'tagnice'}
即使有提高的SuperTag,標籤可能是更相關的,只是因爲tf-idf
賦予了它更大的成績。
爲了解決這個問題,例如,設置爲兩個獨立過濾器的分析儀將會有所幫助。
如上所述,它非常依賴數據以及如何將其存儲在lucene中。乍一看,如果不知道這麼多,那麼提高一倍就會奏效。
標記和SuperTag數組或字符串? – farid
一個字符串,但將在索引上標記。 – Anonymouse