我想通過年齡組低於20分割的數據幀,20至24,25至30和上述30.我能夠用數組來做到這一點的範圍迭代器,但我想知道是否有更好的方法來做到這一點。蟒&大熊貓:如何分割數據幀分成組
gates = [0,20,25,30,50]
total = df.agepreg.isnull().sum()
print("INAPPLICABLE {0}".format(total))
for i in range(0, 4):
t = df.agepreg[(df.agepreg>=gates[i]) & (df.agepreg<gates[i+1])].value_counts().sum()
print("{0} to {1} {2}".format(gates[i], gates[i+1], t))
total += t
print("Total {0}".format(total))
結果是這樣的
INAPPLICABLE 352
0 to 20 3182
20 to 25 4246
25 to 30 3178
30 to 50 2635
Total 13593
該數據來自nsfg。免費書籍thinkstats2在github上有配套代碼和數據。
從'code'目錄中,您可以運行以下行來加載數據框。
import nsfg
df = nsfg.ReadFemPreg()
df
你能發表您的樣本數據? – Zero