1
我調用蜂巢-e數百次在命令行中這樣說:減少蜂巢啓動時間爲許多蜂巢-e調用
cat hive_script.hql | parallel --gnu hive -e '{}'
其中hive_script.hql每行可以獨立運行,並在任何訂購。
是否有任何--hiveconf參數可以減少啓動時間? Apache的網頁似乎表明有可能是在
https://cwiki.apache.org/confluence/display/Hive/LanguageManual+VariableSubstitution
"This is frustrating as Hive becomes closely coupled with scripting languages. The Hive startup time of a couple seconds is non-trivial when doing thousands of manipulations such as multiple hive -e invocations."
我的目標是讓多個應用程序同時運行,我發現使用gnu並行給了我一個腳本的大加速。您能否直接提交多個作業以同時從emr主節點上運行的jdbc客戶端運行? –