oozie

    1熱度

    1回答

    我在執行sqoop export命令(在shell腳本中)時使用oozie時遇到了以下錯誤。 「了java.lang.RuntimeException:無法加載數據庫驅動程序類:oracle.jdbc.OracleDriver」 從CLI(邊緣節點) sqoop出口工作正常。 我已將ojdbc6.jar添加到以下位置。 /opt/cloudera/parcels/CDH-5.7.1-1.cdh5.

    0熱度

    1回答

    我有具有兩個動作watcher1和watcher2叉開始Oozie的工作流程。只要其中的一個即watcher1或watcher2成功,我就需要立即加入。 有什麼在Oozie的,我可以做,以實現上述提到的場景。

    0熱度

    1回答

    我試圖在hadoop 2.7.3上安裝oozie 4.3.0,當時我試圖創建oozie發行版。它出現以下錯誤消息失敗。 at org.codehaus.plexus.classworlds.launcher.Launcher.main(Launcher.java:357) [ERROR] [ERROR] The project org.apache.oozie:oozie-main:4.3.

    0熱度

    1回答

    我們正在Oozie中開發許多不同的工作流程。我們使用3種環境,DEV,PRE和PRO。 我想要做的是在所有3個環境中保留相同的workflow.xml文件,並且只能從Cloudera環境讀取數據庫連接,URL,身份驗證等屬性。通過這種方式,可以對文件進行版本控制並輕鬆部署。可能嗎? 使用谷歌搜索,我看到可能config-default.xml將是一個默認屬性值的地方,但我在我們的Cloudera

    0熱度

    1回答

    觸發多個Oozie協調員與不同的時間表我有一個問題,我需要提交多個協調員(約10),每個不同的時間表和沒有依賴關係每個B /例如:每2小時一次,12小時等)。我看到有一個侷限性,我們應該將協調器命名爲完全沒有前綴或後綴的coordinator.xml(這樣我就不能區分)。我不想讓我的代碼複製10次(維護每個協調器的文件夾)來處理這個問題。 sample folder with multiple c

    -1熱度

    1回答

    我已經安裝了oozie,並且可以在oozie工作流上運行spark工作?我可以獨立運行oozie bundle中的spark庫,而不直接使用oozie。我該怎麼做?請用一個例子來解釋。

    0熱度

    1回答

    我想在使用Hue的Oozie上運行一個簡單的python腳本。我使用的是安裝了所以我也加入了Cloudera管理器,火花的配置(火花服務高級配置片段(安全閥)的火花的conf/spark-env.sh) if [ -z "${PYSPARK_PYTHON}" ]; then export PYSPARK_PYTHON=/opt/cloudera/parcels/Anaconda/bin/pyth

    0熱度

    1回答

    我的主火花項目對其他utils的依賴jars.So集組合的可能是這樣的: 1. main_spark-1.0.jar will work with utils_spark-1.0.jar (some jobs use this set) 2. main_spark-2.0.jar will work with utils_spark-2.0.jar (and some of the jobs u

    1熱度

    1回答

    我創建了一個pySpark工作,它的工作完全正確,提交通過spark-submit。現在,當我試圖通過Oozie它的失敗。我懷疑我輸入的字段有問題。 Oozie中的Spark Action需要這些字段。 Spark Master : local Mode : client Main class : DO I need to enter anything here as its Python +

    2熱度

    1回答

    我需要創建一個自定義EL功能並在uri-template(相當於YEAR,MONTH)中使用它。 有可能嗎?協調員這個區域的關鍵配置是oozie-site.xml?