2013-08-16 109 views
0

我已經構建了大的倒排索引,並且我已經將我的倒排索引存儲爲avro格式,我不想將其作爲服務公開。我想知道有沒有辦法將avro文件加載到solr中,以便solr可以索引我創建的倒排索引。使用Avro文件的Solr索引

這是我倒指數的樣子:

{"key":"10.08","bucket":0,"itemIds":[161049555960]} 
{"key":"100-1000-pcs","bucket":0,"itemIds":[590143038066]} 
{"key":"11-2972","bucket":0,"itemIds":[130941586664]} 
{"key":"1106200","bucket":0,"itemIds":[111132254095]} 
{"key":"1370","bucket":0,"itemIds":[380680582645]} 

回答

0

您可以使用Apache水槽來處理的Avro源,並使用Solr的水槽,生成索引文件。 (我對Flume不是很熟悉。)

+0

http://blog.cloudera.com/blog/2013/07/morphlines-the-easy-way-to-build-and-integrate-etl-apps - 用於-阿帕奇-的hadoop / –