熊貓：讓行，如果他們中的至少一個包含一定的價值

我有熊貓以下數據框熊貓：讓行，如果他們中的至少一個包含一定的價值

letter number 
------ ------- 
a  2 
a  0 
b  1 
b  5 
b  2 
c  1 
c  0 
c  2

我想保持所有行如果至少一個匹配數爲0 結果將是：

letter number 
------ ------- 
a  2 
a  0 
c  1 
c  0 
c  2

爲b沒有匹配數爲0

什麼是做到這一點的最好方法是什麼？謝謝！

來源

2017-04-03 user2475110

您需要filtration：

df = df.groupby('letter').filter(lambda x: (x['number'] == 0).any()) 
print (df) 
    letter number 
0  a  2 
1  a  0 
5  c  1 
6  c  0 
7  c  2

與transform另一種解決方案，其中通過boolean indexing得到0行大小和過濾：

print (df.groupby('letter')['number'].transform(lambda x: (x == 0).sum())) 
0 1 
1 1 
2 0 
3 0 
4 0 
5 1 
6 1 
7 1 
Name: number, dtype: int64 

df = df[df.groupby('letter')['number'].transform(lambda x: (x == 0).sum()) > 0] 
print (df) 
    letter number 
0  a  2 
1  a  0 
5  c  1 
6  c  0 
7  c  2

編輯：

更快未使用groupby，更好是loc與isin：

df1 = df[df['letter'].isin(df.loc[df['number'] == 0, 'letter'])] 
print (df1) 
    letter number 
0  a  2 
1  a  0 
5  c  1 
6  c  0 
7  c  2

與其它解決方案相比：

In [412]: %timeit df[df['letter'].isin(df[df['number'] == 0]['letter'])] 
1000 loops, best of 3: 815 µs per loop 

In [413]: %timeit df[df['letter'].isin(df.loc[df['number'] == 0, 'letter'])] 
1000 loops, best of 3: 657 µs per loop

來源

2017-04-03 12:01:28 jezrael

工程就像一個魅力。驚人。謝謝！ :) – user2475110

我想他知道他需要一個過濾器，他需要的是groupby！ – CodeMonkey

@CodeMonkey - 謝謝;） – jezrael

您還可以通過找出哪些字母保持然後使用isin做到這一點沒有groupby。我認爲這是一個有點整潔個人：

>>> letters_to_keep = df[df['number'] == 0]['letter'] 
>>> df_reduced = df[df['letter'].isin(letters_to_keep)] 
>>> df_reduced 
    letter number 
0  a  2 
1  a  0 
5  c  1 
6  c  0 
7  c  2

我懷疑這會比做一個groupby更快，這可能不是與此有關，但！一個簡單的timeit將表明這種情況：

>>> %%timeit 
... df.groupby('letter').filter(lambda x: (x['number'] == 0).any()) 
100 loops, best of 3: 2.26 ms per loop 

>>> %%timeit 
... df[df['letter'].isin(df[df['number'] == 0]['letter'])] 
1000 loops, best of 3: 820 µs per loop

來源

2017-04-03 12:57:11 bastewart

是的，你是絕對正確的，'groupby'很慢。我稍微修改你的解決方案以獲得更快的解決方案，查看我的答案 – jezrael

沒有直接想到'loc'，是的，看起來不錯。 – bastewart

是的，它與布爾索引完美結合 - 按掩碼和列名過濾。 – jezrael

熊貓：讓行，如果他們中的至少一個包含一定的價值

回答

相關問題