2011-05-04 82 views
1

新手提醒!在asp.net中創建網站的搜索引擎c#

ASP .net | C#| VS2008 | MS SQL服務器2008 R2快遞

我有一個文件名,文件路徑和文件類別的數據庫。我在網站上也有很多靜態頁面。我想開發一個自定義搜索引擎(因爲我不允許使用其他第三方工具 - 基本上他們希望我重新發明輪子)。

當用戶搜索某些內容時,它應搜索文件名以及靜態頁面的內容。文件名可以直接從數據庫中搜索(做到了)。靜態頁面與搜索引擎優化友好,等。

我該如何去索引網站中的靜態頁面?如何在將來添加一些頁面後創建搜索索引?在ASP.net C#中可以使用PHP中的curl函數嗎?

另外我聽說過全文搜索。有關如何查詢全文數據庫的任何鏈接?

P.S:新手:)

回答

1

如果您確定自己的網頁在不久的將來不會改變,請查看SQL全文索引,這應該可以滿足大多數用途。但是如果你需要向前擴展。你應該看看Apache Solr(使用Lucene構建) - 它提供了一個RESTful接口,用於集成到.NET或任何你喜歡的平臺。它提供了所有的好東西可以要求如刻面,而不用擔心兼容性的Java,.NET版本等

可以Solr的輕鬆集成到使用1

+0

感謝您的.NET應用程序!如何爲靜態網頁使用SQL全文索引?內容在頁面中被硬編碼。 – Ranjanmano 2011-05-04 08:01:44

+0

如何閱讀HTML頁面?任何文件處理程序可用? – Ranjanmano 2011-05-04 08:33:14

+1

不確定您是否可以使用SQL Server的導入/導出實用程序導入內容。如果沒有,您可以使用許多現有的HTML解析器輕鬆編寫一些東西。我建議http://www.codeplex.com/htmlagilitypack。 – Mikos 2011-05-05 09:23:45

0

您不需要使用cURL for pHP。 只需使用IO功能來處理目錄(網絡)中的文件列表並獲取其內容並將它們存儲在數據庫中以供將來搜索。從文本中,您可以使用正則表達式檢索頁面標題,元標記。

讓我知道如果你需要這個代碼,如果邏輯適合你。