我想寫一個單詞搜索,它連接到一個特定的網站(巨大的),從用戶那裏接收單詞,搜索網站並返回包含單詞的字符串;這應該用java編寫,並作爲一個小程序。我已閱讀了一些關於此的教程和問題,並瞭解必須完成的工作是:有什麼步驟來爲網站進行詞語搜索?
1.連接到網站並獲取網站的內容並將其保存爲字符串(應該使用webcrawler這將從我自己的代碼連接到網站,並將內容保存到一個字符串+ jsoup庫來解析HTML代碼)。
2.將數據保存到數據庫(在我的情況下是nosql數據庫)。
3.索引數據庫中的數據。
4.查詢數據庫以顯示結果。
5.生成用於顯示搜索結果的UI(我使用swing.japplet)。
現在我qustions是:
1.have我的理解正確,我得走了(請說明我在細節,如果一個步驟是不必要的或必要的)
2.Is有必要的步驟?有一個數據庫?
通知:我要實現它自己,而不使用現成的東西,如Lucene的,Nutch的,Solr的,...
編輯:3人告訴我,小應用程序不適合這樣的事情,那麼應該怎麼是替代品嗎?
很多非常感謝您的幫助。
不,我想自己實現它。沒有準備好諸如lucene之類的東西,爲什麼不使用applets? – fereshteh
@ user2841094 - 我已經解釋了爲什麼applet在我的答案中是個壞主意。 –
它應該是什麼,而不是一個小程序?一個Web服務? – fereshteh