我一直在尋找像瘋了一樣的答案,但是這個我還矇在鼓裏:Lucene的TermPositionVector和檢索索引位置方面
我使用
int[] getTermPositions(int index)
一個TermPositionVector我的
必須有一個字段(已設置爲存儲偏移量和位置)以獲取術語位置,我有興趣在上下文中突出顯示關鍵字。
問題:這些職位對應什麼?顯然不是由TermFreqVector接口返回的
String[] getTerms()
,因爲它只包含我的術語的原始計數。
我正在尋找的是一個辦法讓我的場「標記化」陣列,所以我可以再拔出各地通過getTermPositions(int index)
幫助返回的索引值周圍的條款?謝謝一堆。
我那麼遠,但現在如果我想在源5位和7獲得的話所以我可以在上下文中輸出「over the lazy」來顯示'the'? – ebabchick 2010-08-22 07:18:28