2010-08-12 89 views
1

我想開發一個搜索引擎,但不知道我可以有效使用的後端。請給我建議一個數據庫,我可以在其中存儲數千條記錄並以高效的方式查詢它們。我正在爲自己的興趣開發搜索引擎,所以請不要給我任何類似問題中常見的批評意見。搜索引擎的數據庫

Thankyou

+0

全部取決於您正在搜索的內容。 Bono使用的方法顯然太慢... http://bit.ly/54Dlbs – RedFilter 2010-08-12 16:20:29

+0

爲什麼不使用像Lucene或類似的搜索引擎而不是構建一個? – Paco 2010-10-29 15:04:57

回答

2

查看Cloudant,這是Apache的CouchDB的集羣/可伸縮部署。 CouchDB是NoSQL計劃的一部分(它使用文件系統而不是由數據庫服務器提取存儲),並被告知可以很好地擴展,特別是在使用Cloudant的情況下,儘管我自己並沒有嘗試過。

顯然,對於任何DODB(面向文檔的數據庫,就像Apache所說的那樣),您將不得不從單獨的內存和表索引轉移到包括存儲容量,儘管使用文件系統意味着您通常能夠使用較少的內存(因爲較少的信息被存儲在內存中)。這是一個廣泛的概括,但你明白了。

1

對於成千上萬的記錄,標準的rdbms就足夠了。對於數百萬甚至更高的人來說,你可能想要尋找替代品。

但是既然你是爲了你自己的利益而做這件事,那麼就去做一件讓你明白不同的事。

1

MySQL and 全文索引是一個很好的解決方案,可以搜索數千條記錄。當你放大並接近100萬行時,MySQL全文變得很慢,你將不得不使用另一種方法,如Sphinx