如果我的標題不是非常具有描述性,請道歉。但這是我正在嘗試實現: -根據羣組的頻率計數添加新欄目
我有一個數據幀與2個字段,即src端口和目標端口爲tcp流量。數據幀的csv轉儲看起來像這樣: -
srcp dstp
55647 22
22 55670
2222 56354
55670 22
55670 22
2222 56354
56362 139
22 55670
22 55670
56354 2222
22 55670
56354 2222
coln 1是src端口,coln 2是目標端口。
我想看看對src port-destination端口並獲取它們的頻率並將其存儲在新的coln頻率中。換句話說,對於上面的例子,我想這樣做: -
55647 22 1
22 55670 6
2222 56354 4
55670 22 6
55670 22 6
2222 56354 4
56362 139 1
22 55670 6
22 55670 6
56354 2222 4
22 55670 6
56354 2222 4
正如你可以看到,港口2222-5634擁有4頻率(因爲流量可以在任一方向流動,因此,他們需要確定作爲一個連接),因此在目標/ src端口中的任一個端口中的值2222-56354對應的頻率單元格中重複4的值。
由於仍然爬在蟒蛇階梯,我想知道我該如何實現這一目標。
增加了一些定時使用
sort
和groupby
我的【答案】(https://stackoverflow.com/a/46049704/4909087)。 –