我想按單詞在熊貓數據框上進行彙總。如何在熊貓數據框中按單詞分組統計
基本上有3列與點擊/印象計數與相應的短語。我想將這個短語拆分爲令牌,然後將它們的點擊總結爲令牌,以確定哪個令牌相對好/不好。
預期輸入:數據幀熊貓如下
click_count impression_count text
1 10 100 pizza
2 20 200 pizza italian
3 1 1 italian cheese
預期輸出:
click_count impression_count token
1 30 300 pizza // 30 = 20 + 10, 300 = 200+100
2 21 201 italian // 21 = 20 + 1
3 1 1 cheese // cheese only appeared once in italian cheese