2017-03-02 22 views
2

我有文本文檔數據(約500k)保存在彈性搜索文檔文本映射與它相應的文檔編號。Elasticsearch與IN查詢和得分緩慢的結果

我試圖在特定的一組文件編號(300K appoximately)「示例文字」與進球取分批次的結果和我面臨的極端緩慢的結果。

這裏是映射

PUT my_index 
{ 
    "mappings" : { 
     "doc_repo" : { 
      "properties" : { 
       "doc_number" : { 
        "type" : "integer" 
       }, 
       "document" : { 
        "type" : "string", 
        "term_vector" : "with_positions_offsets_payloads" 
       } 
      } 
     } 
    } 
} 

這裏是請求查詢

{ 
    "query" : { 
     "bool" : { 
      "must" : [ 
       { 
        "terms" : { 
         "document" : [ 
          "sample text" 
         ] 
        } 
       }, 
       { 
        "terms" : { 
         "doc_number" : [1,2,3....,300K] //ArrayOf_300K_DocNumbers 
        } 
       } 
      ] 
     } 
    }, 
    "fields" : [ 
     "doc_number" 
    ], 
    "size" : 500, 
    "from" : 0 
} 

我試圖在其它兩種方式

  • 結果提取的結果,而不在特定的一組文檔評分號碼(我用這個過濾)
  • R但沒有任何特定的文件編號(分批)

這兩個都很快,但問題來了,當我試圖實現兩個。

我是否需要更改映射或搜索查詢或任何其他方式來實現此目的。

在此先感謝。

回答

1

問題是專門用elasticsearch 2.X,升級elasticsearch解決了這個問題。