我有一個基於不同的氣象站的數據集,Python的大熊貓 - 刪除基於NaN的組數閾值
stationID | Time | Temperature | ...
----------+------+-------------+-------
123 | 1 | 30 |
123 | 2 | 31 |
202 | 1 | 24 |
202 | 2 | 24.3 |
202 | 3 | NaN |
...
而且我想刪除「的stationID團體,其中有超過一定數量的NaN更多。舉例來說,如果I型:
**>>> df.groupby('stationID')**
然後,我想放棄基團具有(至少)一定數量的NaN(比方說30)在組內。據我瞭解,我不能GROUPBY使用dropna(THRESH = 10):
**>>> df2.groupby('station').dropna(thresh=30)**
*AttributeError: Cannot access callable attribute 'dropna' of 'DataFrameGroupBy' objects...*
那麼,什麼是做與大熊貓的最佳方式是什麼?
謝謝你的回覆!除溫度外我還有其他變量。因此,使用你的代碼,我將如何考慮NaN的集體總和(即:我想刪除一個組,其中變量1,變量2,變量3,...中的NaN的總和小於閾值) – mmeclimate
@mmeclimate,它的答案不正確/不適合改變問題。你應該問另一個問題,並提供增加的細節。 – Merlin
明白了。我會去做。 – mmeclimate