Python Pandas DataFrame：拆分變量文本列，然後計數

我在數據庫中有一列，每個單元格都有一個由逗號分隔的電子郵件地址列表。每個單元具有不同數量的電子郵件地址。我試圖找出哪個電子郵件地址是最常見的整體。Python Pandas DataFrame：拆分變量文本列，然後計數

我在想我會將所有這些單元格合併到一個單元格中，然後用逗號分隔thm，然後使用Counter函數查找最常用的電子郵件地址。但是我陷入了第一步。有沒有辦法把所有東西結合起來？

2016-05-28 pythonnoob

In[0] import pandas as pd 

In[1] data = pd.Series(["[email protected],[email protected]", "[email protected]", "[email protected],[email protected],[email protected]"]) 

In[3]: data = pd.DataFrame(data, columns=["Emails"]) 

In[4]: pd.Series(data.Emails.str.split(',', expand=True).values.ravel()).mode().values[0] 
Out[4]: '[email protected]'

來源

2016-05-28 15:04:46

Python Pandas DataFrame：拆分變量文本列，然後計數

回答

相關問題