的原貼張貼在https://stackoverflow.com/questions/6007097/design-question-for-notification-system的通知系統設計問題
這裏是進一步澄清的問題:通知系統的目的就是要通知用戶(通過電子郵件現在)時,該網站的內容已被更改或更新或新的發佈。這可以被視爲一個通知系統,人們爲第三方網站定義一個規則或關鍵字,並且通知系統出去爬取第三方網站並創建搜索倒排索引。然後,一個新的鏈接或文檔顯示爲用戶定義的關鍵字或規則(底部關於用例的更多解釋),
澄清使用的案例:假設我是craigslist用戶並正在尋找二手車。我定義了一個規則「本田協議」,「年」1996年和價格範圍從「2000美元到3000美元」。
對於上面的用例來說,什麼是最佳方法,以及如何利用Apache Lucent,Apache Solr和Apache Nutch等開源技術以及Apache Hadoop來解決此用例。 您可以建立搜索引擎的東西,並與規則和關鍵字通知系統。我只是需要一些指針,並幫助如何整合這些開源軟件包來解決用例問題?
任何幫助和指針將不勝感激。我們需要三個重要組件:
1) Web Crawler 2) Index Creator 3) Rule or keyword Mather
任何幫助將不勝感激。我指的是這個將Nutch和Solr集成在一起的維基,用於上述目的http://wiki.apache.org/nutch/RunningNutchAndSolr
這是一個非常廣泛的要求,而不是容易回答的問題。我建議你想出一些更具體的具體問題。你是否開始實施這個系統?你有任何特定的技術要求(即只使用java,mongodb等)? – 2011-05-15 21:15:03