我想在集合中的長查詢和文檔之間獲得餘弦相似度。我使用Lucence來爲收集索引並提交查詢來檢索文檔。Lucene中的查詢和文檔之間的餘弦相似度
但是,我收到以下錯誤的一些查詢。
"Caused by: org.apache.lucene.search.BooleanQuery$TooManyClauses: maxClauseCount is set to 1024"
我複製了一些在查詢中的術語來提高他們的體重。但似乎lucene只是做簡單的布爾檢索,而不是使用tf-idf計算文檔和查詢的餘弦相似度。
有人可以證實這一點嗎?
謝謝克里斯托夫。 – ablimit