你們將如何着手在.Net平臺上創建「實時」搜索引擎。近來對網絡的實時搜索如今非常流行,我希望你們能幫我集思廣益。我最終可能會嘗試製作一些原型,但大多數情況下它只是一種「心理訓練」。實時網頁搜索(在.Net中)
的要求是:
- .NET平臺,IIS,MS SQL服務器或Lucene.Net(文件系統)
- 輸入數據進行索引僅僅是關鍵字加上一些元數據信息 - 沒有進一步的處理所需
- 數據由關鍵詞分組並通過關鍵字的出現次數進行排序
- 沒有歷史數據保持(數據比某一時間固定量被丟棄或移動到其他一些數據存儲舊的)
不知道太多關於主題,這是我想出迄今:
數據通過Web服務送入系統。由於數據已經是關鍵字的形式,因此不會執行進一步的處理。 WS將數據保存到數據庫。選擇查詢以固定的時間間隔執行以返回數據(例如:我們查詢過去一小時的傳入數據並每秒執行一次查詢)。分組和排序在內存中執行以卸載sql服務器。 db中的舊數據每隔幾分鐘就會丟棄。 我不知道如果有很多新的行不斷添加,sql服務器將如何處理。 然後顯示分組和排序的數據。
我相信你們對這種事情有更多的經驗和更好的想法。
問候,
的Ondrej
你能舉出你認爲可能類似的網站的例子嗎? – 2009-11-08 05:09:07
我想到的網站是http://search.twitter.com/。我試圖實現的功能是「趨勢主題」。 – 2009-11-08 13:58:50