我有2個文件,並且正在搜索關鍵字「Twitter」。假設這兩個文檔都是帶有「tags」字段的博客文章。Elasticsearch - 更高的得分如果更高的術語頻率
文檔A在「tags」字段中只有1個詞,它是「Twitter」。 文檔B在「標籤」字段中有100個字詞,但其中3個字詞是「Twitter」。
即使文檔B的頻率更高,彈性搜索也會給文檔A提供更高的分數。但是這個分數是「稀釋的」,因爲它有更多的條款。我如何給文件B一個更高的分數,因爲它具有更高的檢索詞頻率?
我知道ElasticSearch/Lucene基於文檔中的術語數執行一些標準化。我如何禁用這種規範化,以便文檔B得到更高的分數?