2017-04-01 69 views
3

我是新來的scipy。我正在嘗試獲取字符串列的最大發生值。Scipy stats.mode未返回最大值出現

這裏是我的代碼:

import pandas as pd 
    import numpy as np 
    from scipy.stats import mode 

    print ("Maximum Occurence of Store Owner " + str(mode(df_units["StoreOwner"], nan_policy='omit').mode[0])) 

這裏是店主數據的頭幾行:

0 Muhammed MacIntyre 
    1   Barry French 
    2   Barry French 
    3   Clay Rozendal 
    4  Carlos Soltero 

在上面的代碼中,我試圖讓最大OCCURED店老闆值來自數據幀。但是它正在返回所有的值。

回答

0

你可以這樣做:

pdf = pd.DataFrame(dict(A=['a', 'a', 'b', 'c', 'd'])) 
pdf.A.value_counts().idxmax() 

這給了你所發生的價值最常見於數據幀pdf的列A

0

假設你的數據在一個熊貓Seriesser,你可以得到最頻繁出現的字符串:

ser.value_counts()[ser.value_counts().index.max()]