2011-02-22 90 views
2

我需要處理數據庫以便爲文檔條目添加元信息,如td-idf權重。Lucene:通過向其添加IR信息輸出詳細數據

先後,我需要創建文檔對具有相似性的措施,如TD-IDF餘弦相似性,等等

我打算使用Apache Lucene的完成這個任務。實際上,我對檢索或運行查詢不感興趣,而是對數據建立索引並對其進行詳細說明,以生成具有上述文檔對和相似性分數的輸出文件。下一步是將這些結果傳遞給Weka分類器。

我可以用Lucene輕鬆做到嗎? 謝謝

回答

相關問題