2013-07-09 111 views
1

我有一個熊貓數據框,它有一個包含路徑數據的列。 df ['Path']裏面的數據有點像下面的東西計算熊貓數據幀中的路徑數據

/js/jquery.validate.js 
/paidadsimages/arangaya.png 
/images/sinhala-banner.jpg 
/js/jquery.validate.js 

我想統計唯一路徑的排序和顯示。我的預期輸出是類似如下:

/js/jquery.validate.js 2 
/paidadsimages/arangaya.png 1 
/images/sinhala-banner.jpg 1 

無法弄清楚如何做到這一點?

回答

2

你可以簡單地做:

df.groupby('Path').count().sort('Path', ascending=False) 

          Path 
Path        
/js/jquery.validate.js   2 
/paidadsimages/arangaya.png  1 
/images/sinhala-banner.jpg  1 
+0

哦!我並不覺得這很簡單:( –

+0

好吧,熊貓使它看起來很簡單,因爲「幕後」的所有善良。:) –

+0

肯定!我在你的答案中使用了size()而不是count。:)謝謝! –