2012-10-30 52 views
1

我正在製作論壇搜索引擎,它將抓取論壇並幫助用戶查找相關主題和答案。 我將使用php/mysql作爲前端。mysql全文搜索的最佳設置

在每個搜索查詢中,它將使用跨越大量數據的mysql全文搜索(我不知道有多少記錄會在那裏)。

現在我關心mysql優化和設置,以及關於選擇正確的硬件。 我不太瞭解磁盤類型等。

我將從hetzner服務器(http://www.hetzner.de/en/hosting/produkte_rootserver/ex5)開始。

有人可以給任何提示嗎?

+0

論壇上有多少帖子? – bikedorkseattle

+0

一個人的大是另一個人的「小」需要更多的定量值,但比工作中的服務器規格要多,你當然可以處理一個「重要」大小的網站。 – 2012-10-30 08:01:34

+0

不,我正在構建可以抓取其他論壇的搜索引擎。像公共論壇搜索引擎一樣。 – user1070318

回答

1

對於一個大型論壇,使用Solr,Sphinx或ElasticSearch之類的東西會更好。你可以用一個微小的VPS(.5GB內存)或你當前的服務器來做到這一點。我有一個300meg VPS處理約。 1次搜索/秒搜索100萬個帖子。

您必須重新編寫論壇搜索才能使用其中一種搜索方法,但通常這很簡單,因爲它是一個簡單的API調用和解析結果,與使用mysql沒什麼不同。此外,你將不得不計算如何用新帖子更新索引。這可以通過以下兩種方法之一來完成:或者在發佈時將帖子推送到索引,或者按照選定的時間間隔將作業安排到增量索引,並在夜間(在Solr的情況下)執行完整索引。

+0

不,我建立搜索引擎,將抓取其他論壇。像公共論壇搜索引擎一樣。 – user1070318

+0

因此,我可以完全替代mysql的「Solr,Sphinx或ElasticSearch」數據庫平臺。 – user1070318

+1

Solr和Sphinx是企業搜索平臺,您可能希望與數據庫一起運行這些平臺。 ElasticSearch也基於與Solr,Lucene相同的引擎,但是我讀過的人使用它作爲他們的數據庫(就像使用Mongo或CouchDB一樣)。 真的沒有比較使用我列出的與MySQL全文相比的其中一個,他們把它吹出水面。 – bikedorkseattle