2016-07-05 31 views
2

我有一個數據庫連接(使用pyodbc),我需要提交一個新的表到一個新的表。我已經用SQL做了這個,但不知道如何用df做到這一點。任何想法如何改變下面的代碼,使其工作的DF?對於SQL如何使用pyodbc提交df到SQL數據庫?

代碼:

import pyodbc 
import pandas as pd  

conn= pyodbc.connect(r'DRIVER={Teradata};DBCNAME=foo; UID=name; PWD=password;QUIETMODE=YES;Trusted_Connection=yes') 

cursor = conn.cursor() 
cursor.execute(
""" 
CREATE TABLE SCHEMA.NEW_TABLE AS 
(
SELECT ... FROM .... 
) 
""" 
) 
conn.commit() 

我嘗試這個代碼,沒有錯誤,但在數據庫中沒有創建:

import pyodbc 
import pandas as pd  

conn= pyodbc.connect(r'DRIVER={Teradata};DBCNAME=foo; UID=name; PWD=password;QUIETMODE=YES;Trusted_Connection=yes') 

sheet1.to_sql(con=conn, name='new_table', schema='Schema', if_exists='replace', index=False) 
+1

你已經看過[pandas.DataFrame.to_sql](http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.to_sql.html)的文檔嗎?這是否至少可以成爲一個想法? ESP。 SQLAlchemy引擎確實看起來很有希望,但我可能會表面看它;-) – Dilettant

+0

如果您詢問有關此特定SQL(CREATE TABLE .. AS SELECT ...)的信息,那麼您不需要提交它,因爲它是一個DDL,應該總是隱式提交(至少我知道的所有RDBMS(Oracle,MySQL,MS SQL)都是這樣做的)。對於更通用的解決方案,請查看@Dilettant已經提到的'to_sql()' - 它會爲您提供。但我會使用SQLAlchemy,而不是'pyODBC',因爲它正式支持熊貓 – MaxU

+0

我試圖使用.to_sql,但可能使用它不正確...這是我嘗試: sheet1.to_sql(con = conn,name = 'new_table',schema ='Schema',if_exists ='replace',index = False) – nonegiven72

回答

0

to_sql()的文件中明確指出:

con:SQLAlchemy引擎或DBAPI2連接(傳統模式)

使用SQLAlchemy可以使用該庫所支持的任何數據庫。如果是DBAPI2對象,則只支持sqlite3。

因此,您需要將SQLAlchemy引擎傳遞給to_sql()函數,以便從Pandas直接寫入您的Teradata數據庫。

另一種方法是將數據轉儲到不同的數據結構(例如to_dict()),然後使用pyODBC在數據庫上執行DML語句,最好使用綁定變量加快處理速度。