在我的具體使用情況下,被作爲TF-IDF算法的一部分計算的IDF因素打亂了我的查詢得分。基本上,我希望查詢只考慮術語頻率。是否有可能爲特定索引禁用IDF因子,即將其設置爲1?我研究過相似性模塊(版本0.90.X),但還沒有找到任何可以幫助的東西; function_score查詢也一樣。我需要在java中編寫自定義相似類嗎?還是有一個我想要實現的插件?禁用IDF計算
禁用IDF計算
回答
什麼constant_score查詢?
見http://www.elasticsearch.org/guide/en/elasticsearch/guide/current/ignoring-tfidf.html
不要猶豫使用?解釋= true來看看得分是如何工作的。
,你可以在這裏沒有constant_filter:
而且隨着constant_filter查詢(即包裝的實際查詢):
做由於「constant_score」確實關閉了TF和IDF ,我敢肯定,使用Filter時結果與結果相同。 @GlurG似乎只想在TF打開時關閉IDF。你有什麼主意嗎? – humbroll
H,你的意思是改變評分/排名公式?這個頁面應該有幫助=> https://www.elastic.co/guide/en/elasticsearch/reference/current/index-modules-similarity.html。 –
- 1. 如何計算IDF?
- 2. 使用SQL計算TF-IDF
- 3. 如何計算tf-idf?
- 4. 如何計算TF-IDF
- 5. 計算TF-IDF在pyspark
- 6. 爲網頁計算tf-idf
- 7. Python(TextBlob)TF-IDF計算
- 8. 使用gensim的Tf-idf計算
- 9. 使用來自sklearn.feature_extraction.text.TfidfVectorizer的TfidfVectorizer計算IDF
- 10. 測試時計算IDF(如在TF-IDF中)?
- 11. Solr 5 - 禁用idf評分
- 12. 計算IDF上的熊貓數據幀
- 13. 如何計算OracleSQL中的TF-IDF?
- 14. IDF(逆文檔頻率)計算
- 15. DocumentTermMatrix中的R是用下述R代碼,以便計算的TF-IDF相對於計算IDF到基座2
- 16. Python中的通用矩陣計算,TF-IDF
- 17. 用於文檔分類的計算IDF(逆文檔頻率)
- 18. 爲什麼Lucene使用maxDoc而不是numDocs來計算term idf?
- 19. 使用HBase作爲數據源計算文檔的TF-IDF
- 20. Smalltalk和tf-idf算法
- 21. 計算solr和java文檔中單詞的TF-IDF
- 22. Weka GUI - TF-IDF未計算 - 請幫助我的學術工作
- 23. 的Python:如何計算TF-IDF的大型數據集
- 24. sklearn聚類:計算TF-IDF-加權數據的輪廓係數
- 25. 規格化餘弦相似性值來計算基於TF-IDF
- 26. 如何計算字典的tf-idf列表?
- 27. 禁用Google計算引擎上的HTTPS
- 28. Sublime Text Less2Css禁用自動計算
- 29. 禁用不太CSS改寫計算()
- 30. Java:如何使用TF-IDF來計算兩個文檔的相似度?
我相信它與我的問題相關http://stackoverflow.com/questions/22016735/elasticsearch-similary-for-countries,我試圖使用DFR但沒有成功 – Alex