2015-11-16 46 views
0

上午蜂巢和Solr雲 工作,我不得不指數從蜂箱到Solr雲中的數據和我曾嘗試以下鏈接到沒有運氣,我 http://github.org/chimpler/hive-solrhttps://github.com/vroyer/hive-solr-search蜂巢到Solr雲數據遷移

在這兩種情況下我getiing的錯誤存儲處理機

錯誤時FOLLOWIG第二個鏈接

Caused by: java.lang.ClassNotFoundException: org.vroyer.hive.solr.SolrInputFormat 

我抄蜂房的Solr * .jar到所有主節點和從節點的HIVE lib和HADOOP庫中。

配置單元TEZ

VERSIONS USING: 
HADOOP 2.7.1 (Cluster with 3 slaves and one master) 
HIVE 1.2.1 
SOLR 5.3.1(Clusterd in 3 pc's) 

我想指數蜂房數據Solr中配置的任何一個可以幫助我什麼,我在這很想念。

+0

Solr無法找到您的班級。將jar放在'SOLR_BASE/server/solr/YOUR_CORE/lib /'下。 –

回答

0

構建與給定的代碼的jar並添加罐子Hadoop的類路徑

0

確保檢查內置jar包含所需的類,並使用添加jar命令將JAR明確添加到類路徑,這樣就解決了問題。

1

還有另一個工具https://github.com/lucidworks/hive-solr,你可以試試。

爲了從蜂巢中的數據遷移到Solr,您可以創建一個solr-table像:

hive> CREATE EXTERNAL TABLE solr (id string, field1 string, field2 int) 
     STORED BY 'com.lucidworks.hadoop.hive.LWStorageHandler' 
     LOCATION '/tmp/solr' 
     TBLPROPERTIES('solr.zkhost' = 'zk.host:2181/solr', 
        'solr.collection' = 'collection1', 
        'solr.query' = '*:*'); 

然後你就可以將數據插入到Solr的做SQLlike查詢。

INSERT OVERWRITE TABLE solr SELECT b.* FROM books b; 

books與同桌模式蜂巢另一個表。