2012-02-09 58 views
0

我有一個列表(intensityList)1354號碼。他們的範圍從25941.9到1639980000.0,所以有很大的差異,我預計大多數點接近1639980000.0比25941.9。當我製作出一個直方圖繪製直方圖時如何處理值的巨大差異?

plt.hist(intensityList,20) 
plt.title('Amount of features per intensity') 
plt.xlabel('intensity') 
plt.ylabel('frequency') 
plt.show() 

它將幾乎所有的數據放在一個欄中並混淆了x軸。它與測試集合(隨機正常數字)一起工作,所以我很確定它與廣泛的範圍有關。我如何處理這樣的數據集?

編輯: 數據可能非常傾斜,標準偏差遠大於平均值。 (平均值= 6501401.54114,標準devaition = 49423145.7749)

回答

2

很明顯的答案,顯示了當你寫一個問題下來,它可以幫助..我記錄的價值和它的所有花花公子

+0

我只是想說這個! – samb8s 2012-02-09 18:43:19

1

可以增加垃圾桶的數量或只保留你感興趣的範圍內的值。

intensityList = intensityList[intensityList < maxVal] 
intensityList = intensityList[intensityList > minVal] 
+0

也在想這個,但垃圾箱沒有幫助,我也不想丟失數據。使用日誌對我來說效果更好,謝謝你的回答 – 2012-02-09 17:21:50