2013-10-22 96 views
0

我們在Oracle中擁有不同的數據庫模式。我們正在計劃將oracle的一些表格與Hive warehouse進行比較。但是如果我們把oltp的表的sqooping放到順序中,它就可以工作。但爲了更好地使用,我們計劃使用不同的oltps表格parallay,但是它會觸發sqoop表的相同表格。對parallal中不同模式的同一表格不合格

看起來雖然對一個Table進行sqooping,但是一個臨時表將在hdfs中由sqoop創建,並從那裏將數據移動到hive表中,因爲這個原因,我們無法使用parallay。

有沒有什麼辦法,我們sqoop相同的表parallay。

回答

0

您可以使用參數--target-dir在HDFS上指定任意臨時目錄,其中Sqoop將首先導入數據。該參數應與-hive-import一起使用。

+0

我們正在爲我們創建的所有sqoop作業傳遞目標目錄,但是我可以看到,首先它在臨時位置創建一個表,然後將數據複製到target-dir位置(這是我的理解) – GHK