我正在嘗試爲網站構建搜索引擎。它主要是一些PHP和HTML/CSS頁面的集合。現在就是這樣。我在網頁上的所有內容。網站搜索引擎
從我的理解能夠做到這一點,我需要有一個數據庫上的內容,我是否正確?
如果是這樣,我正在考慮這樣做,創建一個四列「關鍵字」「標題」「內容」和「鏈接」的MySQL表。
- 關鍵字 - 將保留一個詞,如果它在查詢中將顯示這是最可能的結果。
- 標題 - 搜索關鍵詞後,搜索標題產生最相關的結果
- 內容 - 要尋找的東西最後的資源,因爲它會被梅西耶我相信
- 鏈接 - 僅僅是屬於特定鏈接行。
我將用PHP和MySQL來實現它,並且將所有內容,標題等放入數據庫中將會很麻煩。這是一個好方法還是我應該看別的東西?
謝謝。
---------------編輯-------------------
Lucene似乎是一個不錯的選擇,然而,即使在閱讀入門指南並在網上瀏覽一下,我也無法理解它是如何工作的,有人能指出我在某個地方以非常基本的方式解釋了這一點嗎?特別考慮到我不知道如何編譯任何東西。
謝謝。
寫一個(好的)搜索引擎是一項相當困難的任務。有許多現有的解決方案可能值得考慮 - http://www.sphider.eu/可能是適合的。 – 2010-08-02 12:31:12
科林,謝謝你的建議,這正是我所需要的,非常感謝。乾杯。 – Kyle 2010-08-02 14:38:47