應用功能的數據幀列

我有一個下面的函數來計算一個值兩個參數X，Y：應用功能的數據幀列

import numpy as np 
import math 

def some_func(pt1,pt2): 
    return math.sqrt((pt2[0]-pt1[0])*(pt2[0]-pt1[0]) + (pt2[1]-pt1[1])*(pt2[1]-pt1[1]))

用法：

a = 1, 2 
b = 4, 5 
some_func(a,b) 
#outputs = 4.24264 
#or some_func((1,2), (4,5)) would give the same output too

我有以下DF：

seq  x y points 
    1  2 3 (2,3) 
    1 10 5 (10,5) 
    1  6 7 (6,7) 
    2  8 9 (8,9) 
    2 10 11 (10,11)

列「點數」是使用下面的一段代碼獲得的：

df["points"] = list(zip(df.loc[:, "x"], df.loc[:, "y"]))

我想申請的some_func功能對整個DF，還通過「序列」

我試圖將它們分組：

df["value"] = some_func(df["points"].values, df["points"].shift(1).values) 
#without using groupby

和

df["value"] = df.groupby("seq").points.apply(some_func) #with groupby

但兩者的他們顯示TypeError說1缺少參數或不支持的數據類型。

預計DF

seq x y points  value 
    1  2 3 (2,3)  NaN 
    1 10 5 (10,5)  8.24 
    1  6 7 (6,7)  4.47 
    2  8 9 (8,9)  NaN 
    2  10 11 (10,11) 2.82

來源

2017-06-28 Liza

我不知道你爲什麼導入numpy的，然後你不使用它。我想你可以通過將你的2d點存儲在np.arrays而不是元組中並且將距離計算爲np.linalg.norm（pt1-pt2）來改善你的代碼。 – Anon

您可以使用groupby與DataFrameGroupBy.shift第一，但這時需要更換NaN s到元組 - 一個可能的解決方案是使用fillna。最後使用apply

s = pd.Series([(np.nan, np.nan)], index=df.index) 
df['shifted'] = df.groupby('seq').points.shift().fillna(s) 
df['values'] = df.apply(lambda x: some_func(x['points'], x['shifted']), axis=1) 
print (df) 
    seq x y points  shifted values 
0 1 2 3 (2, 3) (nan, nan)  NaN 
1 1 10 5 (10, 5)  (2, 3) 8.246211 
2 1 6 7 (6, 7)  (10, 5) 4.472136 
3 2 8 9 (8, 9) (nan, nan)  NaN 
4 2 10 11 (10, 11)  (8, 9) 2.828427

另一種解決方案是在apply過濾掉NaN S：

df['shifted'] = df.groupby('seq').points.shift() 
f = lambda x: some_func(x['points'], x['shifted']) if pd.notnull(x['shifted']) else np.nan 
df['values'] = df.apply(f, axis=1) 
print (df) 
    seq x y points shifted values 
0 1 2 3 (2, 3)  NaN  NaN 
1 1 10 5 (10, 5) (2, 3) 8.246211 
2 1 6 7 (6, 7) (10, 5) 4.472136 
3 2 8 9 (8, 9)  NaN  NaN 
4 2 10 11 (10, 11) (8, 9) 2.828427

來源

2017-06-28 06:42:32 jezrael

f=lambda x,y:some_func(x,y) 
f["value"] = f(df["points"].values, df["points"].shift(1).values)

來源

2017-06-28 06:26:26 Eliethesaiyan

謝謝，但是它顯示Index Error- IndexError：標量變量的無效索引。 – Liza

@莉莎，對不起，我錯過了斑點 – Eliethesaiyan

應用功能的數據幀列

回答

相關問題