2
我有文本文檔數據(約500k)保存在彈性搜索文檔文本映射與它相應的文檔編號。Elasticsearch與IN查詢和得分緩慢的結果
我試圖在特定的一組文件編號(300K appoximately)「示例文字」與進球取分批次的結果和我面臨的極端緩慢的結果。
這裏是映射
PUT my_index
{
"mappings" : {
"doc_repo" : {
"properties" : {
"doc_number" : {
"type" : "integer"
},
"document" : {
"type" : "string",
"term_vector" : "with_positions_offsets_payloads"
}
}
}
}
}
這裏是請求查詢
{
"query" : {
"bool" : {
"must" : [
{
"terms" : {
"document" : [
"sample text"
]
}
},
{
"terms" : {
"doc_number" : [1,2,3....,300K] //ArrayOf_300K_DocNumbers
}
}
]
}
},
"fields" : [
"doc_number"
],
"size" : 500,
"from" : 0
}
我試圖在其它兩種方式
- 結果提取的結果,而不在特定的一組文檔評分號碼(我用這個過濾)
- R但沒有任何特定的文件編號(分批)
這兩個都很快,但問題來了,當我試圖實現兩個。
我是否需要更改映射或搜索查詢或任何其他方式來實現此目的。
在此先感謝。