我有一個包含許多列的熊貓數據框,其中兩個是「電影標題」和「年齡」,我想查找平均年齡最低的前5個電影評價他們的人,但只包括具有至少100個評級的電影(因此至少出現在100行中)。在熊貓數據框中查找重複值和排序的計數
例如:
movie title age
Title 1 10
Title 2 12
Title 2 12
Title 3 13
Title 3 13
Title 3 13
應該改爲:
movie title # of ratings avg age
Title 1 1 10
Title 2 2 12
Title 3 3 13
它可以在相同或一個新的數據幀。謝謝你的幫助!
不能直接在groupby之後使用'filter'方法嗎? –
當我運行它時,這看起來不會過濾掉評分低於100的電影嗎? – user2453297
它適用於數據幀只有列電影標題和年齡。請參閱上面的修改以進行修復 – Alexander