我從其他人創建的Lucene索引開始。我想找到給定單詞後面的所有單詞。我已經提取從索引感興趣的項(org.apache.lucene.index.Term),我可以找到它包含該項目的文件:如何從Lucene索引中獲取下一個術語?
segmentTermDocs = segmentReader.termDocs(term);
while (segmentTermDocs.next) {
doc = segmentReader.document(segmentTermDocs.doc);
...
}
有我找到一種方法該術語在文檔中的位置並提取它後面的術語?
感謝您的想法!這是爲了生成報告,因此性能不是真正的問題。我最終做了一個強力搜索,創建了PhraseQuerys,它包含了興趣項和索引中的所有其他項。那些具有匹配的查詢指出了感興趣的術語後面的術語。 – 2009-08-04 19:34:41