1

我需要一些關於如何使用Cloudera Docker容器運行MapReduce程序/作業的幫助。
我正在使用Linux(ElementaryOS)高配置。筆記本電腦(24GB RAM,i7處理器)。
我能夠安裝Cloudera docker鏡像,運行它,並且沒有問題地執行以下操作:
1.查看#提示符並運行HDFS命令(hadoop fs -ls),但它不返回任何內容。
2.能夠訪問色相編輯器
3.能夠運行Cloudera管理器並啓動所有服務(Everything)。
4.在我的本地環境中,我可以創建一個WordCount MapReduce程序(jar),下載該程序的所有Maven依賴項(不在Docker容器中)。
現在我的問題是:
如何提交此WordCount JAR運行Docker容器?
如何使用上傳的文本文件(HDFS)運行此MapReduce程序/作業(WordCount)?
如何使用Cloudera Quickstart Docker容器執行MapReduce Job/JAR

回答

1

如果您使用8888端口的端口映射啓動容器,則可以訪問包含文件瀏覽器的Hue。因此,您將能夠輕鬆將HDFS文件放入羣集中。

要啓動地圖/縮小作業,您需要將容器複製到容器中,因爲Cloudera沒有在其容器中提供任何容器(至少,這裏沒有記錄:http://www.cloudera.com/documentation/enterprise/latest/topics/quickstart_docker_container.html),這可能具有挑戰性。也許你可以嘗試通過scp添加它。

我自己創建了一些cloudera容器,我按節點類型(masternode,datanode,edgenode)提供了一個容器,我只是在edgenode中添加了一個容器,因爲iy似乎是一個很好的想法。您可以在碼頭集線器中找到我的集裝箱:https://hub.docker.com/r/loicmathieu/cloudera-cdh-edgenode/

+0

謝謝。我認爲scp是將JAR複製到此容器並運行作業的選項。 – Srikanth

相關問題