我有一大堆我正在編制索引的新聞文章。我想要避免編制大量幾乎相同的文章(例如,新聞服務的文章可能會出現多次,日期格式略有不同)。爲什麼我所有的ElasticSearch更像這個命中得分爲零?
所以我想我會做每個文章更像這個查詢。如果我的得分大於某個截止點的話,那麼我認爲這篇文章已經被編入索引了,而且我不打擾它。
但是,當我運行我更喜歡這個查詢時,我得到的所有匹配回來的分數爲零。我無法分辨是否有預期,如果我做錯了什麼,或者我發現了一個錯誤。
我的查詢是這樣的:
POST _search
{"query":
{"bool":
{"filter": [
{"more_like_this":
{"fields": ["text"],
"like": "Doctor Sentenced In $3.1M Health Care Fraud Scheme Justice Department Documents & Publications \nGreenbelt, Maryland - U.S. District Judge Deborah K. Chasanow sentenced physician [snip]"
}
}
]
}
}
而且我回來的結果是:
{
"took": 8,
"timed_out": false,
"_shards": {
"total": 5,
"successful": 5,
"failed": 0
},
"hits": {
"total": 390,
"max_score": 0,
"hits": [
[snip]