0
我有兩個超過100萬行的數據集,我用熊貓分析它(因此它們都是pd.Dataframe
並注意到df1
和df2
)。我需要根據df2的值添加一列到df1。我使用了python列表,但速度非常慢。任何建議要更快?添加一個熊貓列而不創建一個列表
import pandas as pd, numpy as np
numObs = []
for line in np.array(df1):
numObs.append([num for i,num,exp in df2 if i==line[0]][0])
df1['NumObs'] = pd.Series(np.array(numObs),index = df1.index)
你應該解釋你的數據集是怎麼樣的,以及你如何添加這個numobs(條件等),而不是僅僅代碼 –
看起來你所做的只是比較第一個co第一列「df1」的「df2」列是否正確? – EdChum