2014-06-26 63 views
1

我有一個可以來自http url的csv文件。有什麼辦法,我可以從那裏加載它: -Hadoop/Hive:從遠程計算機上的.csv加載數據

這就是我想要

LOAD DATA INPATH 'http://192.168.56.101:8081/TeamHalf.csv' OVERWRITE INTO TABLE csvdata; 
+0

有什麼問題?有沒有錯誤信息,你正在得到? –

+0

沒有其他我試圖從http服務器複製文件。但這是不可能的。我試圖導入結果集的MySQL數據庫配置單元在不同的服務器和文件系統。這適用於我使用sqoop http://stackoverflow.com/questions/24400513/how-to-run-a-sqoop-import-from-a-hive-thrift-client-to-a-hive-thrift-server – vineetv2821993

回答

1

蜂巢Load命令是如下:

LOAD DATA [LOCAL] INPATH 'filepath' [OVERWRITE] INTO TABLE tablename [PARTITION (partcol1=val1, partcol2=val2 ...)] 

1)如果地方規定 - 加載從本地FS文件路徑

2)如果沒有LOCAL - 僅從HDFS文件路徑加載,即: filepath必須引用與表(或分區)相同的文件系統中的文件和

所以從遠程http:路徑加載將無法正常工作。請參閱HIVE DML。可能的方法是(Staging)將數據從遠程http:路徑加載到LocalFS或HDFS,然後加載到Hive Warehouse。

+0

我認爲這是正確的答案,但不幸的是不是我的問題的解決方案。還是謝謝我使用sqoop解決了我的問題。 – vineetv2821993