2011-02-25 40 views
0

我的問題是,我布萊恩開發一個網站,其中每個人都上傳文檔文件,txt文件等。現在,我需要一個組件,關鍵詞和中心指標。而且該索引也應根據Strutured數據進行更新,如文檔可以主動查看等等。當其他用戶試圖根據前面提到的某些關鍵詞和一些結構化數據來查看文檔列表時,用戶應該快速找到列表。它應該支持多語言。我們有一個alogorthim,但我們需要一個開源的API來讀取基於關鍵詞的Unstrutured數據索引文件的文件。任何人都可以在這方面提供幫助。我需要在Java中創建一個搜索引擎的幫助

回答

1

這不是一項簡單的任務,所以爲什麼要在其他人已經完成該任務時進行重新創建:嘗試Apache Lucene

+0

實際上我們並沒有計劃重塑這一點,我剛剛提到了我們正在尋找的解析器的一些技術性部分。我們正在研究,哪一個更好,還沒有最終確定它。我們不想要所有的東西都到位,我們只需要對我們的業務進行一些特定的搜索。 – Kumar 2011-02-25 12:27:08