2016-04-15 290 views
0

我在Kaggle上使用Python進行泰坦尼克號災難競賽。數據集(df)包含與每位乘客相對應的3個屬性 - '性別'(1/0),'年齡'和'Pclass'(1/2/3)。我想獲得與每個Gender-Pclass組合相對應的中位年齡。Python 3.x - 合併熊貓數據幀

最終的結果應該是一個數據幀作爲 -

Gender Class 
1  1 
0  2 
1  3 
0  1 
1  2 
0  3 

年齡中位數將在稍後計算

我試圖創建的數據幀如下 -

unique_gender = pd.DataFrame(df.Gender.unique()) 
unique_class = pd.DataFrame(df.Class.unique()) 

reqd_df = pd.merge(unique_gender, unique_class, how = 'outer') 

但產量獲得的是 -

0 
0 3 
1 1 
2 2 
3 0 

有人可以幫我獲得所需的輸出嗎?

+0

你想要的東西像'df.groupby([ '性別', '階級'])[ '年齡']。中位數()' – JohnE

回答

0

你想(每副結核病)df.groupby(['gender','class'])['age'].median()