2011-10-31 63 views
3

我正在用Java構建搜索引擎。搜索引擎應在80個文檔中搜索輸入到文本框中的單詞,然後顯示匹配文檔的數量,即單詞出現在每個文檔中的次數。在java中構建搜索引擎

首先,我導入了所有的txt文件並創建了一個類Search。

我需要建立一個索引,以便索引80個文檔中的每個單詞,以便我可以開發一種算法來比較輸入的單詞與索引單詞並返回結果。

任何建議一開始將不勝感激!

Regards,

Humam。

回答

8

任何建議一開始將不勝感激!

絕對 - Lucene

的Apache Lucene的(TM)是一個高性能,全功能的文本搜索引擎完全用Java編寫庫。它幾乎適用於任何需要全文搜索的應用程序,尤其是跨平臺的應用程序。

+0

@TedHopp在這篇文章中,有誰有關於Android的任何說法? –

+0

@Hunter - 我一直在閱讀一些Android的帖子,並且仍然在腦海中。當我意識到自己的錯誤時,我刪除了我的評論,希望沒有人看到它。顯然我太遲了。 :) –

+0

其他值得一看的搜索引擎是[Minion](http://minion.java.net/)(來自Oracle Labs)和[egothor](http://www.egothor.org/)。 –

1

看看FTS capabilities of SQLite。這應該做你想要的東西。

+0

我正在直接從內存中讀取文本文件。我沒有使用任何數據庫。只是一個想法,我怎麼能用一個多維數組來存儲所有的單詞作爲索引? – HShbib

+0

查看使用HashMap,目標詞作爲鍵和詞計數/文檔數組作爲值。如果沒有太多的數據,並且如果簡單的相等性測試足以查找單詞,這將是實用的。 –