1
我有一個像下面一個數據幀:添加連續行,如果他們匹配一些列
ID URL seconds
1 Email 9
1 Email 3
1 App 5
1 App 9
1 Faceboook 50
1 Faceboook 7
1 Faceboook 39
1 Faceboook 10
1 Email 39
1 Email 5
1 Email 57
1 Faceboook 7
1 Faceboook 32
1 Faceboook 3
2 App 11
2 App 10
2 Email 56
2 Faceboook 9
2 Faceboook 46
2 Faceboook 16
2 Email 21
我要總結對於因同一ID同一URL的連續欣賞到「秒」列。這就是我正在尋找的結果:
ID URL seconds
1 Email 12
1 App 14
1 Faceboook 106
1 Email 101
1 Faceboook 42
2 App 21
2 Email 56
2 Faceboook 71
2 Email 21
df.groupBy(['ID', 'URL']).sum()
不會在這種情況下工作,因爲它會總結相同的URL的所有情況下,同一個ID,不僅是連續的。
任何想法?
我想你也需要處理'1的Facebook的情況下, ; 2 Facebook「。 –
@JohnZwinck - 我不明白,你能解釋一下嗎? – jezrael
沒關係,我認爲你的代碼實際上處理這種情況。好一個。 –