我有一個重複列名稱的數據幀,這些數據幀會導致重複測量。熊貓數據幀中重複列的平均值
df = pd.DataFrame({'A': randn(5), 'B': randn(5)})
df2 = pd.DataFrame({'A': randn(5), 'B': randn(5)})
df3 = pd.concat([df,df2], axis=1)
df3
A B A B
0 -0.875884 -0.298203 0.877414 1.282025
1 1.605602 -0.127038 -0.286237 0.572269
2 1.349540 -0.067487 0.126440 1.063988
3 -0.142809 1.282968 0.941925 -1.593592
4 -0.630353 1.888605 -1.176436 -1.623352
我想採取的cols平均 'A' 和'B的,使得數據框縮小到
A B
0 0.000765 0.491911
1 0.659682 0.222616
2 0.737990 0.498251
3 0.399558 -0.155312
4 -0.903395 0.132627
如果我做了典型
df3['A'].mean(axis=1)
我得到一個系列(沒有列名),然後我應該建立一個新的數據框與每個col組的手段。另外,.groupby()方法顯然不允許按列名進行分組,而是給出列並對索引進行排序。有沒有一種奇特的方式來做到這一點?
端問題:爲什麼
df = pd.DataFrame({'A': randn(5), 'B': randn(5), 'A': randn(5), 'B': randn(5)})
不會產生4列的數據幀,但合併同名的cols?
要回答你的身邊的問題,爲什麼你認爲定義有重複鍵的字典將工作? – EdChum