1
我知道如何從Term對象獲取文檔集,但您是否可以通過其他方式從Document對象獲取術語/術語頻率?Java Lucene從文檔對象中獲取條款
我知道如何從Term對象獲取文檔集,但您是否可以通過其他方式從Document對象獲取術語/術語頻率?Java Lucene從文檔對象中獲取條款
是的,可以從文檔中獲取條款,但是沒有簡單的API。 IndexReader有一個方法getTermFreqVector,您可以在其中檢索文檔中的術語。您需要構建自定義TermVectorMapper並通過它getTermFreqVector().
在自定義TVMapper中,術語和它們的頻率收集在map()
方法中。一旦getTermFreqVector()
返回,可以從自定義TVMapper中檢索術語。
不幸的是,這項工作的任務需要使用一個真正非常舊的lucene版本,它沒有這個API大聲笑......謝謝反正......我將不得不將這些信息存儲在我自己的散列表或w/e – user623879