2015-08-25 135 views
1

目前我正在使用Cassandra 2.1.5,Hive 1.2.1和Hadoop 2.7.1。我嘗試使用本教程卡桑德拉連接成蜂巢:將Cassandra與Hive連接

http://frommyworkshop.blogspot.com/2013/09/real-time-data-processing-with.html

但似乎我被困在創建外部表:

創建外部表test.pokes(FOO INT,酒吧字符串)存放'org.apache.hadoop.hive.cassandra.CassandraStorageHandler'WITH SERDEPROPERTIES(「cassandra.host」=「127.0.0.1」,「cassandra.port」=「9160」,「cql.primarykey」=「foo」, 「comment」=「check」,「read_repair_chance」=「0.2」,「dclocal_read_repair_chance」=「0.14」,「gc_grace_seconds」=「989898」,「bloom_filter_fp_chance」=「0.2」,「compaction」=「{'class': 'LeveledCompactionStrategy'}」, 「replicate_on_write」=「false」,「caching」=「all」);

,錯誤是這樣的:

失敗:執行錯誤,從org.apache.hadoop.hive.ql.exec.DDLTask返回碼1。 org.apache.hadoop.hive.serde2.lazy.LazySimpleSerDe.initSerdeParams(Lorg /阿帕奇/ hadoop的/ CONF /配置; Ljava/util的/屬性; Ljava /郎/字符串;)Lorg /阿帕奇/ hadoop的/蜂巢/ serde2 /懶惰/ LazySimpleSerDe $ SerDeParameters;

有誰知道如何解決這個問題?

+0

您是否發現問題? – Claudio

回答

2

修復這個hive-cassandra存儲處理程序問題可能很乏味。

您在shell上發現的錯誤日誌可能並不總是有幫助。

請參閱大部分位於/tmp/<user-id>/hive.log的配置單元日誌文件,以獲取有關故障的實際詳細錯誤消息。

晴的原因可能是因爲錯誤的Cassandra的主機名/端口,密鑰空間,關鍵的conf等

希望這有助於中。

0

來自2013博客的關於Hive和Cassandra的信息已過時。例如,'org.apache.hadoop.hive.cassandra.CassandraStorageHandler'前一段時間被'org.apache.hadoop.hive.cassandra.cql3.CqlStorageHandler'取代。我想你需要使用DSE的configure BYOH