有沒有辦法將Sqoop連接到不同的Hadoop羣集,以便可以創建多個Sqoop作業來將數據導出到多個hadoop羣集?如何將Sqoop連接到多個hadoop羣集
0
A
回答
1
將數據導出到多個Hadoop集羣
如果數據進入Hadoop的,這是技術上的一個Sqoop進口
不清楚如何你現在從一臺計算機管理不同的集羣,但你會需要有可用於Sqoop讀取的所有環境的conf文件夾
sqoop命令行程序是一個包裝器,它運行Hadoop附帶的腳本。如果您的計算機上存在多個Hadoop安裝,則可以通過設置
$HADOOP_HOME
環境變量來選擇Hadoop安裝。例如:
$ HADOOP_HOME=/path/to/some/hadoop sqoop import --arguments...
或:
$ export HADOOP_HOME=/some/path/to/hadoop $ sqoop import --arguments...
如果
$HADOOP_HOME
沒有設置,Sqoop將使用默認安裝位置Cloudera的分銷Hadoop的,/usr/lib/hadoop
。
主動Hadoop配置從$HADOOP_HOME/conf/
加載,除非$HADOOP_CONF_DIR
環境變量設置
https://sqoop.apache.org/docs/1.4.6/SqoopUserGuide.html#_controlling_the_hadoop_installation
根據設置如何你的Hadoop,Hortonworks只有Sqoop 1,而Cloudera的(也許MAPR)有Sqoop2,這些指令可能不同,因爲Sqoop2架構不同。
相關問題
- 1. 將Apache Pig連接到Hadoop集羣
- 2. 如何管理配置以連接到多個Hadoop集羣?
- 3. 如何將mac連接到hadoop/hdfs集羣
- 4. 將hadoop羣集連接到多個Google項目中的多個Google Cloud Storage backets
- 5. 用C#.Net連接到hadoop集羣
- 6. h2o連接到hadoop集羣上的集羣
- 7. 如何將多個作業提交到hadoop羣集
- 8. Oracle Hadoop連接器vs Sqoop
- 9. 如何將兩臺獨立的Ubuntu機器連接到同一個hadoop羣集
- 10. Hadoop和多個集羣
- 11. 整合多個Hadoop集羣
- 12. Hadoop集羣和客戶端連接
- 13. 如何連接到mongo sharding羣集
- 14. 如何連接到羣集prommatically
- 15. 如何連接到遠程集羣?
- 16. 如何將一個Hadoop集羣中的數據複製到另一個Hadoop集羣?
- 17. 將Hadoop配置爲多節點羣集
- 18. 將客戶端連接到JBoss集羣
- 19. 將Kundera連接到Cassandra集羣
- 20. 將GraphViz集羣連接到自身
- 21. Hadoop多節點羣集
- 22. Hadoop多主集羣設置
- 23. Hadoop和informix之間使用Sqoop連接
- 24. 連接到neo4j HA羣集
- 25. mongodb連接到atlas集羣
- 26. 如何將Pentaho 6.0連接到Hadoop-Hive
- 27. 如何配置PHP PDO以連接到多主羣集?
- 28. 爲Hadoop集羣
- 29. 如何與邊緣節點上運行的Hadoop集羣時連接到帕拉
我認爲Sqoop2可以做到這一點,但Sqoop1與您的hdfs配置文件密切相關 –
@ cricket_007您能指點我一些關於Sqoop2如何做的文檔。 – Shengjie
sqoop.apache.org提供您需要的所有信息 –