2014-05-22 118 views
0

我試圖通過oozie提交adhoc自然非預先形成的查詢。 從Oozie的蜂巢行動擴展文檔http://oozie.apache.org/docs/3.3.1/DG_HiveActionExtension.html,我可以按照我的工作流程XML文件: -通過oozie運行查詢(無腳本)

 <script>someScriptWithQuery.q</script> 
     <param>TABLE=foo</param>    

這裏someScriptWithQuery.q可以包含一個蜂巢查詢與參數化的表名,需要駐留在HDFS系統。

什麼我想了解的是 - 如果我有一個情況,其中

(1)這是不可能預先形成查詢,但它已經內置在臨時基礎上(基本上意味着我不能使用在上述工作流程XML「腳本」標籤)和

(2)它是不可行的對HDFS系統的腳本(因此我不能參數化整個查詢) -

在這種scenario-如何提交通過oozie查詢?我的問題與這裏的Scheduling an ad-hoc query with Hive/Hadoop using Oozie有點相似。

有沒有其他可能的方法來實現這一目標?任何幫助,將不勝感激。

回答

0

要回答你的兩個問題:

1)是的,你可以,只需添加另一個節點,如:

<script>someScriptWithQuery.q</script> 
<param>TABLE=foo</param> 
<file>someTransformScript</file? 

,然後使用查詢內部的腳本使用 'someTransformScript'

2)如果您的hadoop服務器支持該腳本,則始終可行,例如你的節點有所有必需的依賴關係等等

希望這有助於