0
我正在使用來自第一版和lucene 1.4.3版的lucene代碼。我使用簡單的分析器來分析txt文件中的「book book book」數據。然而,當我使用lukeall瀏覽數據中,排名列顯示,「書」,而我希望它是3lucene如何計算標記索引的時間?
我正在使用來自第一版和lucene 1.4.3版的lucene代碼。我使用簡單的分析器來分析txt文件中的「book book book」數據。然而,當我使用lukeall瀏覽數據中,排名列顯示,「書」,而我希望它是3lucene如何計算標記索引的時間?
什麼給你的印象是盧克的「等級」欄只發生一次會顯示這個詞的出現次數?我相信,在0.9,排名顯示docfreq
,也就是,其中出現術語的文檔的數量(在以後的版本中,「等級」是連續的,而「頻率」規定,統計)。向索引添加更多數據可能會澄清這些統計數據的含義。
任何想法如何知道項目的出現在一個單一的文件數量? – joy
瀏覽的文檔選項卡中的文件,然後使用「的期限瀏覽」區域找到您感興趣的項,它應該提供一個「在這個文檔長期頻率」。 – femtoRgon