2015-07-13 196 views
1

我被導演分組爛番茄評分與以下:過濾在熊貓數據幀

director_counts = bigbadpanda.groupby(["Director"]).size().order(ascending = False) 

print director_counts ---> 

Director 
Woody Allen    44 
Alfred Hitchcock  38 
Clint Eastwood   32 
Martin Scorsese   29 
Steven Spielberg  29 
Sidney Lumet   25 
... 

問: 什麼是對我來說,董事超過2部電影過濾的最佳方式?

對於每位導演的平均電影進行過濾會工作嗎? bigbadpanda.groupby(["Director"]).size().mean()

+0

你能在這裏發佈源數據?對於你正在做的事情可能有一個更優化的方法。 – Manhattan

+0

我剛剛檢查了'過濾'下的文檔。試試這個:'director_counts.groupby(director_counts [「Director」])。filter(lambda:x:x> 2)'用於過濾> 2部電影。我會在一秒鐘內補充一點 –

回答

1

數據我根據你的信息

Director,Movies 
Woody Allen,44 
Alfred Hitchcock,38 
Clint Eastwood,32 
Someone,2 
Someone else,1 

只要做到這一點創建:

df = pd.read_csv('data.txt') 

print(df[df.Movies > 2]) 

輸出:

  Director Movies 
0  Woody Allen  44 
1 Alfred Hitchcock  38 
2 Clint Eastwood  32