2017-07-23 85 views
-1

我讀了一個[數據集(https://outcomestat.baltimorecity.gov/Transportation/100EBaltimoreST/k7ux-mv7u/about)與pandas.read_csv()沒有修改參數。計數器蟒3

  • stolenVehicleFlag列中有0,1和NaN。
  • np.nannp.NaN相比,nans返回False
  • 該列輸入numpy.float64,所以我嘗試將float類型的np.nans 鍵入,他們通常是這樣,但仍然 返回False
  • 我也使用Counter滾動起來嘗試,但每個楠返回上這是怎麼發生的,以及如何處理它的1

    任何想法了 自己覺得呢?

+0

此外,嘗試數學的nan對象和該obj轉換爲np.float64,仍然是False。 – user85779

+0

我想你可以檢查[缺少數據](http://pandas.pydata.org/pandas-docs/stable/missing_data.html),如果需要檢查'NaN's [[isnull]](http:// pandas.pydata.org/pandas-docs/stable/generated/pandas.Series.isnull.html)函數,如'print(df ['stolenVehicleFlag']。isnull())'。 – jezrael

+0

請發佈您到目前爲止嘗試使用的代碼 – cmaher

回答

0

我不知道你期待什麼可以做,但可能這會幫助,如果你想擺脫這種不同的NaN值考慮「DF」你dataframre使用:

df.dropna() 

這將幫助你與NaN值,
您可以檢查更多的信息在這裏:pandas.DataFrame.dropna

+0

我將列放入Counter對象以獲取每個值的計數,包括查看有多少個null/nan條目。有了Counter這個列,我們可以在nan:1的對象中生成數千個單獨的條目,而不是將它們轉換爲nan:11098。所有其他欄目都會翻閱並統計總數。 – user85779