我一直在試圖找到一些關於如何使用Sqoop將序列文件導出到Oracle的文檔。那可能嗎?通過Sqoop將序列文件導出到Oracle
目前我有我的文件(在HDFS中)以基於文本的格式,我使用Sqoop將這些文件導出到某些Oracle的表格,並且它的工作正常。現在我想將文件的格式從文本更改爲序列文件或其他內容(Avro稍後)。那麼,如果我想使用Sqoop將不同的文件格式從HDFS導出到Oracle,我需要做什麼?
任何信息將不勝感激。
在此先感謝。
我一直在試圖找到一些關於如何使用Sqoop將序列文件導出到Oracle的文檔。那可能嗎?通過Sqoop將序列文件導出到Oracle
目前我有我的文件(在HDFS中)以基於文本的格式,我使用Sqoop將這些文件導出到某些Oracle的表格,並且它的工作正常。現在我想將文件的格式從文本更改爲序列文件或其他內容(Avro稍後)。那麼,如果我想使用Sqoop將不同的文件格式從HDFS導出到Oracle,我需要做什麼?
任何信息將不勝感激。
在此先感謝。
不幸的是,目前Sqoop不支持導出序列文件。
這可能無助於將數據導出到oracle Db。但只是想到把它放在這裏,因爲sqoop支持序列文件的導出 - 只需檢查一下 - Sqoop export for sequence file
非常感謝您的回答。有沒有解決方法?只是爲了將數據導出到Oracle(假定結果是由MR作業生成的),我必須以普通的基於文本的格式輸出它? 儘管我沒有使用HCatalog,但是在某處(可能會誤解我),如果我在HCatalog中創建模式,那麼我可以使用任何格式導出/導入數據,並且還可以在其中插入Sqoop?或者僅僅是Hive纔是真的?再次感謝。 – dreamer
你有可能使用Avro文件嗎?在那裏支持導出,它具有二進制格式,壓縮和Hive集成的所有優點。 –
是的,我可以使用Avro,因爲我已經使用序列文件作爲我的MR作業的輸入部分,我以爲我會先嚐試使用序列文件,然後使用Avro。你能否指導我一個很好的文檔或教程,顯示由sqoop導出avro文件到Oracle?再次感謝您的回覆。 – dreamer