0
我在數據庫中有一列,每個單元格都有一個由逗號分隔的電子郵件地址列表。每個單元具有不同數量的電子郵件地址。我試圖找出哪個電子郵件地址是最常見的整體。Python Pandas DataFrame:拆分變量文本列,然後計數
我在想我會將所有這些單元格合併到一個單元格中,然後用逗號分隔thm,然後使用Counter函數查找最常用的電子郵件地址。但是我陷入了第一步。有沒有辦法把所有東西結合起來?
我在數據庫中有一列,每個單元格都有一個由逗號分隔的電子郵件地址列表。每個單元具有不同數量的電子郵件地址。我試圖找出哪個電子郵件地址是最常見的整體。Python Pandas DataFrame:拆分變量文本列,然後計數
我在想我會將所有這些單元格合併到一個單元格中,然後用逗號分隔thm,然後使用Counter函數查找最常用的電子郵件地址。但是我陷入了第一步。有沒有辦法把所有東西結合起來?
In[0] import pandas as pd
In[1] data = pd.Series(["[email protected],[email protected]", "[email protected]", "[email protected],[email protected],[email protected]"])
In[3]: data = pd.DataFrame(data, columns=["Emails"])
In[4]: pd.Series(data.Emails.str.split(',', expand=True).values.ravel()).mode().values[0]
Out[4]: '[email protected]'