2013-11-04 94 views
1

任何人都可以告訴我,HCatalog使用前是否需要安裝?或者它可以用作一個jar文件?HCatalog在使用之前是否需要安裝?

我有Cloudera在虛擬機上運行,​​我可以使用HCatalog作爲我的MR作業,Pig,Hive沒有任何問題。我認爲相同的MR代碼可以與另一個hadoop安裝平臺一起工作,但顯然情況並非如此,在HCatInputFormat.setInput()上拋出異常。當我使用Pig -useHCatalog時,我被提示使用錯誤,這意味着它不知道什麼是-useHCatalog作爲參數。

沒有想過這是已經使用上了Cloudera之前HCatalog ...

回答

0

是的,你需要安裝和啓動HCatalog服務器。 HCatalog應該帶有最新的Hive tar軟件包。

入住這裏的Apache Hive documentation的細節,

基本上你需要,

  1. 安裝的MySQL數據庫HCatalog

  2. 運行服務器安裝腳本

    份額/ hcatalog /腳本/hcat_server_install.sh -r root -d dbroot -h hadoop_home -p portnum

  3. 啓動HCatalog服務器

    出口HIVE_HOME = hive_home $ HIVE_HOME/sbin目錄/ hcat_server.sh開始

+0

謝謝。因爲我正在測試DataStax中的某些東西,但他們擁有所有Hive,Pig等等1來耦合比最新更早的版本......思考如何在這種情況下使用HCatalog。 – Kevin

+0

HCatalog已於2013年3月26日後遷移至Hive,HCatalog發佈0.5,查看[here](http://hive.apache.org/hcatalog/index.html)。現在HCatalog版本號應該跟在Hive後面。最新的是0.12.0。 –

0

正如指出的那樣,你不需要單獨安裝hcatalog如果你工作與蜂巢0.12或更高版本。

相關問題