2013-06-12 43 views
4

我在我的電腦中安裝了Hortonworks SandBox。也嘗試了一個CSV文件,並且以表格結構的方式獲取它的OK(Hive + Hadoop),如果我想將我當前的SQL Databse遷移到沙盒(MS SQL 2008 r2)中,我將如何執行此操作?還想連接到我的項目(VS 2010 C#)。如何將SQL數據加載到Hortonworks中?

可以通過ODBC連接嗎?

我聽說sqoop用於將數據從SQL傳輸到Hadoop,所以我如何使用sqoop執行此遷移?

回答

1

您可以編寫自己的作業來遷移數據。但Sqoop會更方便。要做到這一點,你必須download Sqoop和相應的連接器,用於Apache Hadoop的Microsoft SQL Server連接器。您可以從here下載它。請通過Sqoop user guide。它包含所有信息的細節。

而且Hive支持ODBC。你可以在page找到更多信息。

+0

您可以嘗試Teland以及 – Nishant

1

我寫下你需要在Hortonworks沙盒要經過安裝JDBC驅動程序,並得到步驟它的工作:http://hortonworks.com/community/forums/topic/import-microsoft-sql-data-into-sandbox/

要連接在你的C#項目的Hadoop可以使用Hortonworks蜂巢ODBC驅動程序從http://hortonworks.com/thankyou-hdp13/#addon-table。閱讀PDF(這也是在該網頁),看看它是如何工作(我用蜂巢服務器類型2與用戶名沙箱

+0

在當前沙箱沒有/ usr/lib/sqoop dir @kloarubeek。我應該創建它還是在/ home/sqoop目錄中創建一個lib文件夾? – webDEVILopers

+0

如何查找當前路徑解決方案:http://de.hortonworks.com/community/forums/topic/hdp-2-2-sandbox-could-not-find-sqoop-folder/ – webDEVILopers

相關問題