在AWS上安裝Cloudera。試圖讓它安裝,以便它有多個命名隊列,我可以使用JDBC連接到隊列並執行查詢。使用JDBC連接到Hadoop中的命名隊列
從我已經能夠到目前爲止收集,一旦隊列在那裏,連接到他們與JDBC是相當簡單的,因爲它只是具有格式:
http://<server name>:<port>/<queue name>
但是,目前還不清楚亂跑看看不同文檔的大量文檔如何設置隊列。看起來,如果你有一個hadoop-site.xml文件,你可以在那裏添加屬性mapred.queue.name和一個逗號分隔的字符串。但Cloudera沒有該文件。它有一個mapred-site.xml,但添加該屬性,然後轉到命令行並要求列出隊列仍然只是返回默認值。
然後我們嘗試使用FairScheduler,但它是基於紗線的新紗線,它具有在指定隊列之間平衡工作的概念。
所以,我在找的是:
- 辦法只是創建2個隊列,例如工程和營銷
- 表明,一旦我有他們,我可以連接使用JDBC任何一個
- 和執行查詢
後,我可以不用擔心使用ACL來進行隊列具有不同的訪問權限數據的不同部分,並可能管理對資源的訪問。現在,只是想表明我可以獲得通過指定隊列公開的數據。