2014-10-17 62 views
0

我正在使用Python建立與greenplum的連接並自動運行代碼。爲此,我使用這些驅動程序psycopg2,psycopg2.extensions & psycopg2.extras。我還必須建立與Teradata的連接並運行一些代碼並將Teradata中的表格傳輸到greenplum。有人可以請建議一些驅動程序或方法來做到這一點?我聽說可以在python中使用數組或alteryx來做到這一點,但我什麼也沒有。如何使用Python將數據從Teradata傳輸到Greenplum?

+0

是否可以使用ODBC連接驅動程序?谷歌表示他們存在於Greenplumb。如果您可以爲這兩個數據庫使用ODBC驅動程序,則可以使用pyodbc執行SQL。下面是使用pyodbc http://stackoverflow.com/a/26727920/2573907非常簡單的看一下ODBC數據移動。 (你不會想要使用易變的表格)。 – DrBailey 2014-11-04 05:13:10

回答

1

我猜數據量至少是中等大小 - 數百萬或更多。

  1. FastExport或Teradata Parallel Transport將Teradata數據導出到 平面文件或命名管道。
  2. 使用Greenplum的首選方法進行攝取使用批量文件 從平面文件或命名管道加載數據。

其他選項可能包括使用Python通過JDBC調用Teradata FastExport API,但是您仍然需要弄清楚如何通過Greenplum高效地獲取數據。