Lucene索引是否使用tf-idf作爲權重?是否可以爲每個文檔定義自己的統計信息和權重,並將它們「插入」到Lucene中?Apache lucene倒排索引
0
A
回答
0
只要通過這個例子。它可以幫助助你知道你可以把自定義更改在索引過程
http://lucene.apache.org/core/4_3_1/demo/src-html/org/apache/lucene/demo/IndexFiles.html
1
是,默認的評分算法採用了TF-IDF,並在TFIDFSiilarity documentation是完全記錄。
有許多方法可以自定義文檔的評分。
- 最簡單也是最常見的是在查詢時在索引時間字段或查詢字詞上加入提升。
- 許多查詢類型修改用於該查詢的評分。例子包括ConstantScoreQuery和DisjunctionMaxQuery。
- 您使用的
Similarity
定義了評分算法。您可以選擇一個不同的(例如BM25Similarity)。 - 通常可以通過擴展一個更高層次的實現,如
DefaultSimilarity
,TFIDFSimilarity
,或SimilarityBase
相關問題
- 1. Lucene倒排索引訪問計數
- 2. 僅將Lucene用作倒排索引
- 3. Apache lucene索引
- 4. lucene是否在搜索時遍歷整個倒排索引?
- 5. Java - 倒排索引
- 6. 的Apache Lucene索引作家
- 7. 的Apache Lucene的索引
- 8. Lucene的倒排索引是否存儲在內存中?
- 9. 散列索引vs倒排索引
- 10. 搜索引擎中的倒排索引
- 11. Python倒排索引效率
- 12. Python - 查詢倒排索引
- 13. 倒排索引節點addword
- 14. 大型XML文件的Apache Lucene索引
- 15. 更新Apache Lucene索引文件
- 16. 從apache lucene索引使用Field.index
- 17. Lucene的Apache不把我的舊索引
- 18. Apache Lucene - 創建和存儲索引?
- 19. 手動搜索倒排索引
- 20. 模糊搜索+倒排索引
- 21. 在數據庫中創建Lucene索引 - Apache Lucene
- 22. Lucene索引:排除某些術語
- 23. 搜索Lucene索引
- 24. 搜索Lucene索引
- 25. Lucene索引搜索
- 26. Zend Lucene索引
- 27. Lucene索引
- 28. Jackrabbit Lucene索引
- 29. Lucene索引MAXFieldLength
- 30. Lucene索引
[僅鏈接答案】(http://stackoverflow.com/help/deleted-實現自己
Similarity
,答案)拋在一邊,在這個例子中,我沒有看到任何文件記錄真正被處理的地方。 – femtoRgon