2013-07-31 61 views

回答

0

對您的問題默認爲5,但您可以根據需要進行更改。

儘管如此,你有2個不同的閾值: mlt.mintf,最小期限頻率 - 低於該術語將在源文檔被忽略的頻率,DEFAULT_MIN_TERM_FREQ = 2 mlt.mindf,最小文檔頻率 - 處的頻率至少在這麼多文檔中不會出現的字將被忽略,DEFAULT_MIN_DOC_FREQ = 5

我建議看看http://wiki.apache.org/solr/MoreLikeThis的所有細節。

如果你想了解「更多類似這樣的」工作,我也建議閱讀這篇優秀的文章http://cephas.net/blog/2008/03/30/how-morelikethis-works-in-lucene/

0

我要說的條款應顯示(ATLEAST)的200個文件(共40000)將其提交給建議清單。

40000分之200= 0.005

200 - >號的文件,其中一個特定的術語是本。
40000 - >文件總數。