如果我有40000個文檔索引,我的閾值是.005。在搜索建議中出現之前,有多少文檔應包含某個關鍵字?Solr建議:有多少文檔。應該包含某個詞
1
A
回答
0
對您的問題默認爲5,但您可以根據需要進行更改。
儘管如此,你有2個不同的閾值: mlt.mintf,最小期限頻率 - 低於該術語將在源文檔被忽略的頻率,DEFAULT_MIN_TERM_FREQ = 2 mlt.mindf,最小文檔頻率 - 處的頻率至少在這麼多文檔中不會出現的字將被忽略,DEFAULT_MIN_DOC_FREQ = 5
我建議看看http://wiki.apache.org/solr/MoreLikeThis的所有細節。
如果你想了解「更多類似這樣的」工作,我也建議閱讀這篇優秀的文章http://cephas.net/blog/2008/03/30/how-morelikethis-works-in-lucene/
0
我要說的條款應顯示(ATLEAST)的200個文件(共40000)將其提交給建議清單。
40000分之200= 0.005
200 - >號的文件,其中一個特定的術語是本。
40000 - >文件總數。
相關問題
- 1. Nutch/Solr - 文檔中至少包含一個巨大詞條=「content」
- 2. 一個類應該包含多少行?
- 3. 在Solr中包含多字停用詞
- 4. Solr - 包含多個單詞的同義詞
- 5. 批次 - 打開該文件名中包含某個詞
- 6. 如何在`solr`中找到僅包含搜索詞的文檔
- 7. Solr建議與多個有效載荷
- 8. 從Solr返回單個詞建議
- 9. 對於包含查詢詞的文檔不返回Solr文檔片段
- 10. 單個集合在mongoDb中可以包含多少個文檔?
- 11. 我應該使用twitter bootstrap選項卡包含多少文件?
- 12. mongodb全文搜索建議多個詞
- 13. 我應該在WAR中包含多少個Portlet?
- 14. 如何處理SOLR中的「文檔包含至少一個巨大的術語」?
- 15. Solr可以在文件中包含多語言停用詞嗎?
- 16. 有多少個id可以包含itemref?
- 17. 應該創建多個文檔類型還是多個索引?
- 18. 含有子元素的Solr文檔?
- 19. solr不建議完整的單詞
- 20. 該評論應該包含在Hubot的文檔中?
- 21. 我應該創建多少個線程?
- 22. 我應該創建多少個DTO?
- 23. 返回關於Solr的整個文檔建議
- 24. Solr建議不返回多個條款
- 25. Solr建議者:回覆多個字段
- 26. 我應該多長時間將文檔上傳到CloudSearch(Solr)?
- 27. 在solr中包含同義詞
- 28. - 建議的最大對象大小應該是多少?
- 29. 有多少個HTTP動詞?
- 30. 如果行包含某個單詞,請複製包含該單詞的單元格