任何一個可以建議我,讓每一個文件的字命中(無發生)在Lucene的最好方法是什麼?..獲取每個文檔的搜索詞點擊(點的數量)在Lucene的
1
A
回答
1
SpanTermQuery.getSpans會給出一個列舉文檔以及術語出現的位置。文檔已排序,因此您可以統計每個文檔顯示的次數,而忽略位置信息。
5
Lucene使用基於字段而不是基於文檔的索引。 爲了讓每個文檔詞數:
- 遍歷文件使用IndexReader.document()請將isDeleted和()。
- 在文檔d中,使用Document.getFields()迭代字段。
- 對於每個字段f,使用getTermFreqVector()獲取條款。
- 查看術語向量和每個術語的和頻率。
- 每個字段的詞頻總和會給你文檔的詞頻矢量。
+1
+1。您可能不得不考慮文本發生的詞幹和其他轉換。例如,如果您在詞幹字段中搜索「美麗」一詞,則索引中的實際詞將是「美麗」。 – 2009-12-25 04:36:42
相關問題
- 1. 在Lucene/Lucene.net搜索中,如何計算每個文檔的點擊次數?
- 2. Lucene中每個文檔的點擊次數
- 3. Lucene。我如何計算每個文檔的點擊次數?
- 4. 如何在Lucene上只搜索每個搜索到的文檔
- 5. GMSAutocompleteViewController想要獲取搜索欄上的文本搜索點擊
- 6. 搜索兩個Lucene文檔
- 7. Azure搜索:如何獲取包含檢索詞的文檔
- 8. 點擊lucene的總數
- 9. 獲取大量單詞的Google點擊次數
- 10. 點擊率根據搜索詞
- 11. 獲取Lucene的n個最新文檔
- 12. 查詢elasticsearch - 爲每個主機獲取每個節點的文檔數
- 13. 如何在搜索圖標的點擊獲得搜索表單
- 14. Datatables搜索點擊的div
- 15. 點擊後的搜索欄
- 16. java lucene索引和搜索每行創建一個文檔的示例代碼
- 17. 如何計算lucene索引中每個文檔的術語數?
- 18. 在特定文檔上搜索lucene
- 19. 獲取文檔ID在Lucene的
- 20. 使用Solr,Sphinx或Lucene搜索 - 按點擊排名的搜索結果
- 21. Lucene 4.6獲取文檔向量
- 22. Lucene搜索like詞條搜索
- 23. 從每個按鈕的輸入文本中獲取值點擊
- 24. Lucene:多詞詞組作爲搜索詞
- 25. 在Lucene中搜索句子並獲取匹配詞
- 26. 在Lucene索引的字段中搜索多個單詞
- 27. 如何使用Lucene搜索引擎API搜索多個站點?
- 28. 如何獲取Lucene TopDocs中文檔的唯一數量?
- 29. Lucene的查詢的詞的文檔
- 30. Zend搜索Lucene浮點數範圍搜索
lucene java或lucene .net? – skaffman 2009-12-21 11:54:44