2013-02-28 158 views
0

我是pandas數據分析庫的新手。我需要完成的任務如下:在熊貓數據框中選擇並求平均值

給定一個包含一組列C的數據框(表),選擇列A的子集中的值相同的所有行,並將它們組合到一個單行其中其他行C \ A的值被平均。

(目的是測試一個程序的多個運行,並平均化的值等在那些其中的參數是相同的情況下的運行時間。)

例如:

a  b  c  d 
eggs ham  1.0  0.0 
eggs ham  0.0  0.5 
spam eggs 0.0  1.0 
spam eggs 0.0  1.0 

應結合:

a  b  c  d 
eggs ham  0.5  0.25 
spam eggs 0.0  1.0 
選擇列時

ab(這意味着cd應該是平均值)。

我有什麼選擇?

回答