2016-04-28 64 views
0

我有一個數據框,其中有一個名爲genres的列。每個流派都有多個值作爲電影名稱。下面的方式表示:Python:在Pandas中使用group_by函數的散點圖

Movie_val Genre 
     2  Fantasy 
     11  Adventure 
     12  Comedy 
     2  Fantasy 
     2  Adventure 
    11  Adventure 
    13  Thriller 
    12  Fantasy 
    10  Thriller 
    11  Drama 
    1  Fantasy 

我需要GROUP_BY每個基於movie_val的類別,並且在散點圖像集羣繪製每一組(例如:在一個又一個集羣或顏色,冒險動作片電影等等)。我檢查了matplot lib庫,它期望集羣圖的兩個值X和Y.我的group_by命令會有很多電影值(例如,冒險流派有很多值,我不確定如何將這些值作爲一個組來繪製)。

此外,這些group_by值中的每一個都應以不同的顏色表示。 我試過下面的代碼吧圖。但我正在尋找分散的一個,如下格式不允許分散。

 result = df.groupby(['genres'])['Movie_val'].quantile(0.5) 
    result.sort_values().plot(kind='barh') 

我想在python中使用熊貓庫。任何幫助將不勝感激。

回答

0

seaborn庫可能可以給你你想要的。當然,您仍然需要選擇數據框中的哪一列將爲散點圖提供座標。

import seaborn as sns 
g = sns.FacetGrid(df, hue="Genre", size=5) 
g.map(plt.scatter, "column name for x dimension", "column name for y dimension", s=50, alpha=.7) 
g.add_legend(); 

又見更復雜的小平面這裏的例子: https://stanford.edu/~mwaskom/software/seaborn/tutorial/axis_grids.html

+0

我使用GROUP_BY功能組類型和它有一個組的多個值。在我的情況下,具有12作爲值的movie_value將在一個軸上可用,並且它具有需要在另一個軸上繪製的多個流派。我需要知道這怎麼會發生。我已經提到了我的group_by命令,並且需要繪製它 – SRS

相關問題