0
我有一個聊天數據集,我想創建一個會話組並統計他們發送的消息數量。python羣聊ID
這是我的數據。該數據是 「ID」的聊天記錄,其名稱是Jimmy。
Sender Receiver Text
ID person1 HI
person1 ID Hello~
ID person1 My name is Jimmy
person1 ID Nice to meet you!
ID person1 Nice to meet you, too
ID person2 Hi
person1 ID Hi there
ID person2 My name is Jimmy
person1 ID My name is Abi
ID person2 Nice to meet you
... .... .....
「ID」可以與多個人聊天。
我想要計算每個對話的消息數量。
在這種情況下,兩個對話都有5條消息。
我已經編寫了代碼,但由於我的數據很大,所以看起來效率很低。
#chat_df is the dataframe of chat data
df = []
total_message =[]
receiver_id = chat_df["receiver"].unique()
for x in rid:
total_message.append(len(chat_df[(chat_df["receiver"] == x) | (chat_df["sender"] == x)]))
df.append(chat_df[(chat_df["receiver"] == x) | (chat_df["sender"] == x)])
有沒有一種更有效的方法來獲得一對雙人的聊天數據?
謝謝!這就是我需要的! 還有一個問題.. 如果我想計算每條消息的文本數量,以便更高的計數(5位以上),你會如何建議完成它? 非常感謝你! – jimmy15923
謝謝。我正在考慮你的第二個問題,我認爲沒有更好的解決方案,因爲['boolean indexing'](http://pandas.pydata.org/pandas-docs/stable/indexing.html#boolean-索引)。 – jezrael
什麼意思是文本的數量?數字?或短信的長度? – jezrael