-1
所有,Sqoop進口蜂巢ORC
我有sqooping問題,我sqooping左右爲一個表數據的2TB,然後需要寫ORC表機智h上。什麼是實現
1)sqoop Dir1中的所有文本數據和寫HQL加載到ORC表,其中的腳本在卡盤和處理失敗的頂點問題
2)sqoop數據並追加到蜂巢表最好的方法(你有沒有這樣做呢?)
3)sqoop蜂巢進口寫所有的數據蜂巢ORC表
這是最好的辦法嗎?
所有,Sqoop進口蜂巢ORC
我有sqooping問題,我sqooping左右爲一個表數據的2TB,然後需要寫ORC表機智h上。什麼是實現
1)sqoop Dir1中的所有文本數據和寫HQL加載到ORC表,其中的腳本在卡盤和處理失敗的頂點問題
2)sqoop數據並追加到蜂巢表最好的方法(你有沒有這樣做呢?)
3)sqoop蜂巢進口寫所有的數據蜂巢ORC表
這是最好的辦法嗎?
選項三會更好,因爲您不需要創建配置單元表並再次將數據加載到該表中並以orc格式存儲該數據,這對於2tb數據來說是一個漫長的過程,因此它最好在sqoop中給出,以便它可以直接將數據推送到採用orc格式的配置單元表中,但是當您將配置單元表中的數據返回給rdbms時,必須使用sqoopserde
請問Google。 SO不是推薦網站! –