2011-10-23 61 views
1

好的,我對這個網站真的很陌生,我認爲它只有2個小時,所以我需要一段時間才能習慣這個網站並提出不違背準則的問題。Java中的搜索引擎算法?

我所要做的就是實現一個小型搜索引擎,它不是我的家庭作業或工作,我只是爲了學習而獲得報酬。

serch引擎將有一個簡單的用戶界面,供用戶提出問題並顯示結果。

這個結果顯然需要組織,它需要顯示它找到的結果數量,最相關的結果將顯示在頂部 它也會鏈接到它找到的材料。 我有一些在java中的expereince,因此我需要一個算法來實現這一點。

有一百萬個不同的搜索引擎,一些在java中,一些在php和其他語言中,但是他們已經實現了,我需要從頭開始實現這個算法。

我爲了這個目的買了一本書,叫做「算法導論」,但這並不像我想的那麼有幫助。 我需要在java中的一些指南,我需要做的代碼形式的菜單。

如果有人可以幫忙,我會非常感激。 謝謝

+1

你的問題太廣泛了。實施搜索引擎是一個非常大的話題/主題,根據您的具體需求,有很多不同的方法可以實現。您已經擁有了開始所需的所有信息(書籍,參考實現和現有搜索引擎來模仿(並用於查找有關該主題的資源))。剛開始計劃/編碼。如果您使用編碼部分打開牆,可以回到特定的代碼問題。 – Mat

+0

在網頁搜索引擎中?或者用於搜索您擁有的文件系統或數據庫? – marnir

回答

7

您可以使用庫Apache Lucene,這是一個成熟的基於Java的信息檢索系統。
您將必須創建一個IndexWriter,並將其用於index您的文檔集合。
然後,您應該使用IndexSearcher搜索文檔。請閱讀文檔,因爲可能你所需要的全部都已經建成。

如果你想從頭開始實施它,我建議先閱讀約Information Retrieval。一個很好的來源將是Introduction to Information Retrieval

+0

我正在考慮一個文件系統 – james

+0

@james:我不關注,請解釋你的評論。 – amit

+0

我的意思是說我正在考慮實施搜索引擎來搜索文件。 – james