我申請的NGRAM過濾器,以我的串場:Elasticsearc - NGRAM過濾器保存/保持原有令牌
"custom_ngram": {
"type": "ngram",
"min_gram": 3,
"max_gram": 10
}
但作爲一個結果,我失去令牌比NGRAM範圍更短或更長。
例如找不到「iq」或「a4」等原始令牌。
我已經在ngram之前應用了一些特定於語言的分析,所以我想避免複製整個字段。我正在尋找用ngram擴展令牌。
任何想法或ngram-suggestions?
這裏是我的分析儀,它使用custom_ngram濾波器的一個示例:
"french": {
"type":"custom",
"tokenizer": "standard",
"filter": [
"french_elision",
"lowercase",
"french_stop",
"custom_ascii_folding",
"french_stemmer",
"custom_ngram"
]
}
我不認爲我明白是什麼問題。 –
例如,由於ngram過濾器而搜索「a4」時,字符串「駕駛奧迪a4」將不匹配。然而,「driv」,「drivi」......將匹配。我需要有兩個。 – Philipp