0
我有一個DataFrame(x,y)座標,我想轉換爲數組來執行成對距離計算。熊貓 - 將列轉換爲分組數組座標
df = pd.DataFrame({'type': ['a', 'a', 'a', 'b', 'b', 'c', 'c', 'c'],
... 'x': [1, 3, 5, 1, 3, 1, 3, 5],
... 'y': [2, 4, 6, 2, 4, 2, 4, 6]})
所需的輸出 - 分組/彙總座標的陣列中的一個新的數據幀,這樣我可以應用機能的研究,以每個數組:
grp = coordinates
a array([[1, 2],
[3, 4],
[5, 6]])
b array([[1, 2],
[3, 4]])
c array([[1, 2],
[3, 4],
[5, 6]])
距離計算我想申請...
grp['distances'] = grp.apply(lambda x: scipy.spatial.distance.pdist(x['coordinates'], 'euclidean'), axis = 1)
我似乎無法得到groupby函數來做到這一點。有任何想法嗎?