2012-11-30 31 views
2

我對elasticsearch和HBase都有點新意,但對於一個研究項目,我希望將這兩者結合起來。我的研究項目主要包括搜索大量文檔(doc,pdf,msg等),並通過 mapreduce作業從文檔中提取存儲在HBase中的文檔中的命名實體。HBase和elasticsearch整合如MongoDB河

是否有人知道是否有類似於HBase的MongoDB river插件的東西?或者可以將我指向一些關於集成ElasticSearch和Hbase的文檔?我已經在網上查找任何文件,但不幸的是沒有任何運氣。

親切的問候, 馬亭

回答

1

我不知道任何elasticsearch HBase的集成的,但也有可以使用像LilySolBase

+0

TNX您anwser,是的,我知道莉莉,但儘管它似乎工作正常。我更多地尋找更多的供應商少解決方案... – Martijn

+0

這是SolBase :) –

+0

啊對不起,我覺得早。但似乎即使solbase不是我正在尋找的東西。 Solr基於模式,我喜歡關於elasticsearch的東西,它是無模式的。這允許我創建一些列族,但可以自由填寫列值。您會看到一個文檔包含不同的元數據屬性,然後是pdf或msg。 – Martijn

0

不知幾Solr和HBase的集成任何打包的解決方案,但只要您的mapreduce以正確的方式預處理數據,使用您選擇的編程語言編寫一個簡單的批處理作業應該相當容易,該工作語言從HBase讀取並提交給ElasticSearch。

+0

Tnx您的回覆。我一直在尋找來自Mozilla的bagheera,有一些模塊可以讓他們將文檔作爲elasticsearch導入到hbase中。希望能幫助我解決我的問題 – Martijn