我有以下的大熊貓據幀如何在value_counts上對熊貓數據框進行子集化?
import pandas as pd
df = pd.read_csv("filename1.csv")
df
column1 column2 column3
0 10 A 1
1 15 A 1
2 19 B 1
3 5071 B 0
4 5891 B 0
B 0
6 12 B 2
7 13 C 2
8 20 C 0
9 5 C 3
10 9 C 3
現在,使用功能value_counts()
會給我中某列的每個值的計數,例如
df.column3.value_counts()
1 3
2 2
3 2
但是,我想根據給定列中的值的數量子集一個熊貓數據框。例如,在上面的數據框df
中,我想對具有3個或更多個唯一值(不包括0)的行進行子集分析。在這種情況下,所產生的數據幀將是
df
column1 column2 column3
0 10 A 1
1 15 A 1
2 19 B 1
作爲行爲值2和3僅具有兩行,即,2,3只在column3
發生兩次。什麼是熊貓的方式來做到這一點?
它爲什麼是'g.name'? – ShanZhengYang
這是該組的關鍵,即在這種情況下'column3'中的唯一值。你也可以使用'g.column3.iat [0]'。我只是覺得它更短。 – Psidom