我有一個熊貓數據幀,看起來在本質上類似如下:有效的方式來反覆提取行集團在熊貓
Group Date Value etc.
1 01/01 10
1 05/01 10
1 08/01 5
1 15/01 5
1 18/01 2
1 21/01 10
...
2 02/01 3
2 15/01 4
2 25/01 1
...
3 01/01 6
....
我想提取每個Group
包含在所有行單獨大熊貓數據幀組(例如,帶有按鍵1,2,3等的字典)。執行此操作的顯而易見的方法是使用循環遍歷組的切片(如df[df.Group == 1]
)。
但是,對於非常大的數據集(700k行,有30k個組),切片技術非常慢,因爲必須爲每個30k組訪問整個700k事務。
有關快速方法的任何建議,每個700k行只需訪問一次即可執行分組?謝謝!
爲什麼你需要它在不同的數據集? –
我需要對每組行執行一系列操作,並且只需要來自該組的行。否則,我會在整個集合上重複執行切片操作。 – David