2011-03-01 16 views
2

我們正處在一個分類廣告網站,你可能已經知道,我們需要一個非常好的搜索引擎的發展。在我們的項目中,左側的過濾菜單是必須的。無論如何,我問我們是否應該使用zend lucene,或者我們應該自己安裝lucene服務器,並將我們的搜索文件與其api連接起來?我無法找到任何性能/基準比較結果,並想在這裏問。我想聽聽你的意見在以下方面:限制,優點,disadanteges ..你推薦zend lucene用php或者lucene自己搜索並用php做端口搜索?

+0

你應該向我們提供的條目,語言和預期的交通一些關於信息量和重建的頻率。這些因素可以在建議中發揮重要作用。 – allnightgrocery

+0

每天大部分10k數據條目(比如說二手車有許多屬性,例如模型,製作,功能等等),每個月的頁面瀏覽量高達10億次。 –

回答

4

以我的經驗Zend的Lucene是很好的少量數據,但減慢當您添加更多的數據非常快。我不得不研究一個新的zend lucene替代品,因爲它的性能並沒有削減我目前的項目。長話短說,我們使用建立在Apache Lucene上的Solr。索引70k +文章從幾小時到幾分鐘。

我想補充一點Sphinx排在我的決定緊隨其後並會值得一看。

+0

Jeff,Sphinx是我們項目中唯一基於文本的解決方案;我們不能提供搜索過濾器,如:具有「2門」「4門」選項(多個字段)的汽車,因此,我不使用獅身人面像。關於Solr vs zend;在「限制」方面,實際上在我們的網站上;每天將有大約10k每日數據輸入(例如分類廣告)和每月大約10億次獨特視圖。所以我們關注更多的搜索,而不是索引時間。 (索引將進入一個廣告之後,所以它放棄到1天的自動化,而不是幾分鐘) –

+0

所以我之後的索引容量的搜索能力這一翻譯的有關數字。 –

+1

那麼如果你正在談論這些類型的數字,那就不要使用Zend_Lucene解決方案。我們用等待搜索結果的Zend_Lucene從9到10秒降低到了使用Solr的毫秒。那是7萬條記錄。 –

1

我會建議Solr - 它需要最少的精力來安裝,並具有PHP interface。它也有faceting(側面的過濾器)的內置支持,相當於fast and scalable

+0

你好!你知道關於solr和lucene的示例性能圖嗎?因爲solr位於lucene的頂部。我真的在zend lucene,lucene和solr之間,還不能決定。 –

+0

Solr建立在Lucene(這是一個圖書館,而不是一個搜索引擎)之上 - 兩者之間沒有直接的比較。你將不得不編寫代碼來使用Lucene,它與Solr中已經存在的代碼非常相似。如果正確配置的Solr比使用Lucene的自定義實現慢得多,我會感到非常驚訝。我會建議您查看其他人從Solr獲得的性能,並檢查它是否符合您的要求。 – nikhil500