2010-04-13 168 views
1

我正在尋找關於信息檢索系統(例如Lucene)如何存儲其索引以實現快速「相關性」查找的一些文檔。我的Google-fu失敗了:我發現了一個描述Lucene文件格式的頁面,但它更側重於每個數字有多少位,而不是數據庫如何用於快速查詢。信息檢索數據庫格式?

當然有人有一些有用的書籤,他們可以引用我。

謝謝!

回答

2

Lucene索引是倒排索引,因此關於這個主題的搜索應該是相關的,如:

+0

誠然,這是一個倒排索引,但如果我有一個10項查詢,是lucene真的在倒排索引中查找每一項,相交結果並對它們進行排名? – jemfinch 2010-04-13 18:33:21

+0

實質上,是的,如果你看看Lucene評分公式(http://lucene.apache.org/java/3_0_1/api/all/org/apache/lucene/search/Similarity.html),你會看到每個查詢術語用於構建將用於在索引中搜索的矢量 – 2010-04-13 18:38:29