pysql = lambda q: pdsql.sqldf(q, globals())
str1 = "select coalesce(ID1, H_ID, [Alternate Source Unique
Identifier]) as Master_ID, [Alternate Source Unique Identifier] as Q_ID
from crosswalk;"
with Timer("Load master_ids:"):
master_id_list = pysql(str1)
print("Records: {}".format(len(master_id_list)))
master_id_list.head()
pySQL運行只需5秒鐘!想用熊貓讓它看起來/像sql一樣工作
我想用Python語言編寫的第二個腳本,因爲我不能用pysql :(,任何想法?在Python,請您第二個腳本的最好的翻譯?
我已經做了2個命題,但沒有真正有效在時間 第一個沒有熊貓(這是必要的)
def coalesce (df, column_names):
i=iter(column_names)
column_name=next(i)
answer=df[colum_name]
for column_name in i:
answer = answer.fillna(df[column_name])
return answer
coalesce(df, ['first', 'third', 'second'])
謝謝您的建議!
爲什麼你使用''副本()''方法?我認爲這會造成很多開銷。 – Dimgold
謝謝,你建議你代替複製什麼? –