2016-02-12 13 views
0

我在elasticsearch上使用術語聚合來獲取380607390(380百萬)索引中最常用的單詞,並且在我的應用程序中收到超時。如何獲得elasticsearch最常用的單詞?

聚合字段是帶有簡單分析器的文本(該字段包含發佈內容)。

我的問題是:

條款聚集是正確的聚集這樣做呢?有大量的內容字段?

{ 
    "aggs" : { 
     "keywords" : { 
      "terms" : { "field" : "post_content" } 
     } 
    } 
} 

回答

1

您可以使用min_doc_count來嘗試此操作。你當然不想得到那些只用了一次或兩次或三次的詞...... 你可以根據你的要求設置min_doc_count。這肯定會減少 時間。

{ 
    "aggs" : { 
    "keywords" : { 
     "terms" : { "field" : "post_content", 
       "min_doc_count": 5    //----->Set it as per your need 
     } 
     } 
    } 
} 
+0

好的,我現在嘗試用min_doc_count設置爲100,但不行!還過濾查詢到一個文件的子集來減少工作,有些事情是錯誤的,我現在說,但是什麼? – JoeLoco

+1

你是否再次獲得'timeout'? – Richa

+0

是的,我有兩個envs,相同的搜索/ aggs over一個env工作正常! – JoeLoco

相關問題