2008-11-18 102 views
3

隨着stackoveflow.com透視(隊2-3工程師建立旨在擴展一個網站項目)是否有意義花力氣在發展過程中的早期建立一個基於Lucene/Autonomy的搜索...而不是基於數據庫的全文搜索。比較:DB全文搜索,以搜索引擎(Lucene的)

優點/缺點:
隨着像nutch或autonomy這樣成熟的Lucene實現,在後期轉向Lucene(這是不可避免的)的成本可以忽略不計。
大量添加額外的索引服務器(比如用nutch)來維護增長的搜索索引相對容易。
隨着Lucene的實現,我會最有可能需要一個額外的服務器主內存中的索引(在縮放的過程更加早期)。

回答

4

數據庫全文檢索性能其他數據庫中各不相同,但它是迄今爲止最簡單的選項設置。因此,從這一點開始,如果證明它太慢,轉到lucene或獅身人面像。

+0

如果你的數據庫的全文搜索是不夠好,使用它(除非你有一個充滿異國情調的要求,如DB-獨立)。 – alex 2008-11-29 18:59:41

0

你應該把它孤立雖然 - 不要開始投擲選擇所有在你的代碼,如果你知道你會用搜索引擎查詢替換它們。用精簡的抽象層包裝數據庫的全文搜索,確保在不應用數據庫的情況下不使用數據庫功能。

我第二次接受的答案,但 - 過早優化這裏絕對是邪惡的。