2016-12-08 70 views
1

我是熊貓和ML的新手。我正在閱讀這本書Think Stats並正在進行練習。隨附的代碼將NSFG Cycle 6數據作爲編碼示例的數據框加載。 其中一項練習指示用戶使用數據框中的可用功能來顯示名爲「preglngth」的系列。然後它要求與NSFG的Codebook交叉檢查結果。我的代碼如下,Python,如何打印指數值範圍內分組的熊貓系列

import nsfg 
df = nsfg.ReadFemPreg() 
df.prglngth.value_counts(sort=True) 

而且我得到以下輸出,

 
+----------------+ 
| 39  4744 | 
| 40  1120 | 
| 38   609 | 
| 9   594 | 
| 41   591 | 
| 6   543 | 
| 37   457 | 
| 13   446 | 
| 4   412 | 
| 8   409 | 
| 35   357 | 
| 36   329 | 
+----------------+ 

等等...

名稱:prglngth,D型:Int64的

碼書link以下列方式顯示:

Screenclip

我想根據上面顯示的索引值範圍顯示系列值。我該怎麼辦? 謝謝。

克里希。

回答

0

pd.qcut()函數可以幫助您bin值。你想要在索引值上存取,所以你在groupby函數中傳遞它們。

s = df.prglngth.value_counts(sort=True) 
s.groupby(pd.cut(s.index, [0, 13.5, 26.5, 100])).sum()