PHP彈性搜索全文搜索 - 排序方式相關度

我想在Elastic Search中使用「％LIKE％」條件獲取「用戶」數據。PHP彈性搜索全文搜索 - 排序方式相關度

GET user/_search 
{ 
    "query": { 
     "query_string": { 
      "fields": ["firstname", "lastname"], 
      "query": "*a*" 
     } 
    }, 
    "sort": { 
     "_score": "desc" 
    } 
}

它返回所有數據都帶有「_score」：1的結果。

名爲「Kunal Dethe」的數據是第一個，「Abhijit Pingale」是第二個。

但如預期的那樣，「Abhijit Pingale」應該首先出現，因爲字母「a」出現了兩次，而不是「Kunal Dethe」。

任何想法爲什麼？

編輯： 使用的「NGRAM」解決方案，但對於像「AB」一文中，該克被分解爲「a」，「B」，然後「AB」作爲「min_gram」被設置爲1因爲即使輸入單個字符也應返回結果。

但我希望搜索僅作爲「ab」完成。

當然，可以增加「min_gram」，但可以動態設置爲查找文本的長度嗎？實現你想要什麼的

POST /user 
{ 
    "settings": { 
     "analysis": { 
      "filter": { 
       "substring": { 
        "type": "nGram", 
        "min_gram": 1, 
        "max_gram": 15 
       } 
      }, 
      "analyzer": { 
       "substring_analyzer": { 
        "tokenizer": "standard", 
        "filter": [ 
         "lowercase", 
         "substring" 
        ] 
       } 
      } 
     } 
    }, 
    "mappings": { 
     "user": { 
      "properties": { 
       "id": { 
        "type": "long" 
       }, 
       "firstname": { 
        "type": "string", 
        "analyzer": "substring_analyzer" 
       }, 
       "lastname": { 
        "type": "string", 
        "analyzer": "substring_analyzer" 
       } 
      } 
     } 
    } 
} 

//Searching via 

GET user/_search 
{ 
    "query": { 
     "query_string": { 
      "fields": ["firstname^2", "lastname"], 
      "query": "ab" 
     } 
    } 
}

來源

2016-06-09 Kunal Dethe

當您使用通配符時，計分沒有意義。這就是爲什麼它這樣做。另外，使用前綴通配符會引起麻煩，因爲它必須逐字檢查倒排索引中的每一項。 – pickypg

但我確實需要「\ * a \ *」之類的查詢來完成。有沒有其他方法可以實現這一點？ –

如果你想避免通配符，你需要一個涉及ngrams的解決方案。看到這個：http://stackoverflow.com/questions/34331249/elasticsearch-query-string-dont-search-by-word-part/34331544#34331544 – Val

一種方法是指定一個分析儀使用（即standard）在搜索時讓你的輸入沒有得到由默認NGRAM分析儀分析。這樣你只能匹配ab令牌，也不能匹配a和b令牌。

GET user/_search 
{ 
    "query": { 
     "query_string": { 
      "fields": ["firstname^2", "lastname"], 
      "query": "ab", 
      "analyzer": "standard"  <--- add this 
     } 
    } 
}

一個更好的辦法，但是，是設置"search_analyzer": "standard"在映射而不是使用在搜索時的NGRAM方法爲好，這是當只有指定"analyzer": "substring_analyzer"的情況。因此，如果您搜索ab，那麼您只會匹配ab令牌，因爲在搜索時它不會被記錄。

"mappings": { 
    "user": { 
     "properties": { 
      "id": { 
       "type": "long" 
      }, 
      "firstname": { 
       "type": "string", 
       "analyzer": "substring_analyzer", 
       "search_analyzer": "standard"  <-- add this 
      }, 
      "lastname": { 
       "type": "string", 
       "analyzer": "substring_analyzer", 
       "search_analyzer": "standard"  <-- add this 
      } 
     } 
    } 
}

來源

2016-06-14 04:32:10 Val

運作良好。謝謝。應用「映射」解決方案。 –

真棒，很高興它解決了！ – Val

我還需要一個幫助。當用「ab」搜索時，即用一個空格，我們可以用「ab」得到更高分的結果，然後用「空格」得到其他結果嗎？ –

PHP彈性搜索全文搜索 - 排序方式相關度

回答

相關問題