2015-04-28 33 views

回答

1

從網絡服務器到HDFS,您需要使用Flume或其他適當的工具。 Sqoop用於從RDBMS導入/導出數據。

0

既然你已經說過源代碼是網絡服務器和數據是非結構化的,Flume是你應該找的!

水槽是爲 分佈式的,可靠的,並且可用的服務有效地收集,聚集,和移動日誌的大量 數據

http://flume.apache.org/

如果數據源是RDBMS和數據是結構化,那麼Sqoop將符合該法案。

Sqoop被設計用於 的Apache Hadoop和結構化的數據存儲之間高效傳輸批量數據例如關係數據庫。

http://sqoop.apache.org/

相關問題