2
Lucene是一個很好的開源的indexng庫,我的問題不在於如何使用這種索引工具,而是爲了學習和理解它們是如何設計的。如何設計全文索引系統?
也許我應該讀取Lucene的源代碼,但我似乎無法找到關於如何完成這項偉大工作的任何教程。
那麼,有沒有其他方法或書籍可以幫助我獲得如何設計這樣的索引系統的具體理解?
謝謝。
Lucene是一個很好的開源的indexng庫,我的問題不在於如何使用這種索引工具,而是爲了學習和理解它們是如何設計的。如何設計全文索引系統?
也許我應該讀取Lucene的源代碼,但我似乎無法找到關於如何完成這項偉大工作的任何教程。
那麼,有沒有其他方法或書籍可以幫助我獲得如何設計這樣的索引系統的具體理解?
謝謝。
Lucene背後的科學被稱爲信息檢索。當你開始欣賞信息檢索背後的算法和數據結構時,你已經完成了,Lucene或Sphinx只是解決你的任務的工具。首先你可以通過Inverted Index數據結構。
有關信息檢索算法和數據結構的偉大的書可以在這裏找到:http://nlp.stanford.edu/IR-book/這斯坦福文字是一個很好的資源,並在未來以瞭解如何信息檢索系統一個很好的起點設計