如何使用hortonworks-data-platform在AWS上設置單個節點的hadoop客戶端?然後運行一個簡單的字數統計例子。 然後使用同一臺機器運行火花字計數作業。如何在AWS上通過ambari設置單個節點Hadoop和Spark客戶端
-1
A
回答
0
安裝
首先,在註冊AWS帳號並創建版本的Ubuntu 14.04 。的EC2實例(Ubuntu的16將無法正常工作)。添加自定義的TCP規則以在安全組上打開端口0-65535。
您不需要自己安裝任何jdk或其他依賴項。
二,請點擊此鏈接到你安裝HDP EC2實例 http://docs.hortonworks.com/HDPDocuments/Ambari-2.1.2.0/bk_Installing_HDP_AMB/content/_download_the_ambari_repo_ubuntu14.html 請注意,您需要在您的實例
sudo apt get install ntp
安裝NTP,不要忘記改變根到ubuntu設置服務器時。
三,下載數據文件並將其複製到hdfs。我用
sudo wget https://www.dropbox.com/s/cz25tno9pi817ft/large_data4word_counting?dl=0#
## extract the file and rename it to be large_data
sudo -u hdfs -copyFromLocal /large_data/
你可以使用sudo -u HDFS或chmod來給你上的目錄當局
運行MapReduce的字數工作
圍棋到文件夾/usr/hdp/current/hadoop-mapreduce-client。
sudo -u hdfs hadoop jar hadoop-mapreduce-examples.jar wordcount /large_data /result
然後,你可以找到在結果文件夾字數作業結果。
sudo -u hdfs hadoop dfs -copyToLocal /result /result
運行星火字數工作
編寫Python程序
import sys
from operator import add
from pyspark import SparkContext,SparkConf
if __name__ == "__main__":
conf = SparkConf().setAppName("Spark Count")
sc = SparkContext(conf=conf)
text_file = sc.textFile("/large_data")
counts = text_file.flatMap(lambda x: x.split(' ')) \
.map(lambda x: (x, 1)) \
.reduceByKey(add)
counts.saveAsTextFile("/output")
運行作業
export HADOOP_CONF_DIR=/etc/hadoop/conf/
sudo -u hdfs /usr/hdp/current/spark-client/bin/spark-submit --master yarn \
wordcount.py
相關問題
- 1. Hadoop客戶端節點配置
- 2. 如何設置Elasticsearch客戶端節點?
- 3. 如何在Chef客戶端上設置節點屬性?
- 4. Hadoop客戶端節點安裝
- 5. hadoop單節點設置
- 6. 如何通過類org.apache.hadoop.conf.Configuration在java客戶端中設置hadoop複製?
- 7. 通過Ambari安裝Spark
- 8. 如何更改AWS節點客戶端用戶代理?
- 9. 如何從客戶端節點運行hadoop平衡器?
- 10. 如何在Hadoop中的單個數據節點上設置單個數據節點目錄?
- 11. 通過客戶端實體上的「客戶端狀態」字段設置權限
- 12. Boto3:如何設置在桶客戶端標記參數AWS
- 13. 如何限制客戶端數據放置到hadoop中的特定節點?
- 14. Hadoop單節點集羣設置問題
- 15. unbuntu下的單節點Hadoop設置12.0.04
- 16. 單節點的Hadoop設置unbuntu 10.04
- 17. ReactJS和AWS-S3從客戶端上傳
- 18. 在Windows上設置單節點hortonworks hadoop集羣
- 19. 在Mac上設置單節點Hadoop集羣
- 20. 在Ubuntu上設置單節點Hadoop集羣14.04
- 21. 如何從客戶端節點
- 22. 如何使用Ambari服務在所有hadoop節點上部署jar?
- 23. 如何在一臺機器上設置多個Web客戶端
- 24. Spark Controller通過ambari安裝失敗
- 25. 如何在單個Hadoop節點上寫入多個記錄
- 26. 在Amazon AWS中爲S3客戶端設置正確的端點PHP PHP
- 27. 節點:Windows上的Mysql客戶端庫
- 28. 如何創建和配置Hadoop客戶端腳本?
- 29. 的Hadoop 2.6.1單節點設置:數據節點未啓動
- 30. 節點JS服務器和客戶端