2013-11-02 41 views
0

前言:不定搜索羣集(Solr的VS ES VS Datastax EE)

這個問題是不是要求彈性搜索與Solr的對比Datastax Solr的(Datastax EE)的開放式的比較。 (雖然歡迎評論部分的鏈接)。

項目:

我一直在建立一個域名類型的Web服務了一段時間。這樣做,我意識到這種服務的指數增長。

背景:

我想知道哪些特定的搜索平臺可以讓我保存和無限膨脹。是的,我意識到你現在可以分裂一塊Solr碎片 - 所以如果我有一個20碎片solr雲,我可以稍後將它們分割成40個(我想呢?再次...這不是無限的)。不確定在事物的彈性搜索方面。由於Cassandra的體系結構,Datastax(EE)似乎是答案,但(A)由於它們沒有提供許可證價格的透明度 - 我必須向他們透露我的earnings我很快就會想起Oracle的流血緩慢地收費策略,因爲我這是一個巨大的威懾力量。 (B)當他們說他們將完整的MapReduce與Hive,Sqop,Mahout,Solr和Pig整合在一起時 - 我想我不想花一輩子學習一些不適合我的項目的花花公子。我希望有一個搜索平臺,我可以無限期地每個月添加20億份文檔(或任何數量的文檔),而不必擔心我會在前面創建一個分片太少的集羣。

問題:

誠然,我的背景部分被盜用的無知,我想糾正。我的目的不是要冒犯或淡化這些驚人的技術。我只是想知道他們中的哪些可以擴展而不必擔心過度生長的碎片[我在這裏永遠拿出這個詞 - 謝謝你在下面的評論]。或者可以嗎?不是硬件方面,而是碎片。我可以使用哪個平臺,而不必擔心其20TB或2PB的未來增長。假設服務器,交換機等的硬件預算是不確定的。

+0

彈性搜索處理增長非常好。您可以毫不費力地在新盒子上添加JVM(節點)。集羣將嘗試在那裏洗牌碎片並保持碎片的平衡。它還可以設置副本並確保它們不在主碎片的同一節點上。永遠不是我適用於任何技術的術語。我想在某種程度上,分散的網絡開銷和在永遠*大小的集羣上搜集大量查詢將變得很大。 – mconlin

+0

@mconlin這是非常有幫助的。我看到有一本關於ES的書,但它看起來像v.9當前版本的v.2。有沒有足夠的變化足夠渲染.2太舊了?什麼是最好的學習方式/你如何學習ES?再次感謝... – Chris

+1

.20到.90是非常不同的。他們在自己的網站上有很多很好的帖子和視頻,其中包括很好的縮放。我在工作中使用它,並不斷學習。 – mconlin

回答

0

關於您的收入,該鏈接指向啓動程序。如果您有資格,這使得軟件100%免費。

+0

此鏈接http://www.datastax.com/startup – phact

1

DataStax Enterprise(DSE)本身不是「搜索平臺」。 DSE提供的功能之一是能夠搜索存儲在Cassandra中的數據。 Cassandra正被用於存儲和訪問企業運營數據。這個想法是,一旦您確定Cassandra是您的企業運營數據的首選數據存儲區,則DSE/Solr集成允許您對該數據執行豐富的搜索。大型企業正在尋求從傳統關係型數據庫遷移到更先進的平臺,如NoSQL數據庫,如Cassandra,其中可擴展性和分佈式計算(包括多數據中心支持,可調整一致性和強大的操作工具,包括OpsCenter GUI儀表板)是常態。 DSE的Solr集成有利於遷移。