我爲我的數據挖掘項目使用HIGGS數據集。在解析Python中的數據時,我收到以下錯誤:Python無效浮點數()
ValueError: invalid literal for float(): -8.854051232337951660e-
對於許多相同類型的值,我得到此錯誤。我正在使用Apache Spark作爲分佈式環境。
這是我在數據集中的一行。
1.000000000000000000e+00,8.004817962646484375e-01,-3.643184900283813477e-01,-4.785313606262207031e-01,2.399173498153686523e+00,**-8.854051232337951660e-01**,1.204909682273864746e+00,-8.518521487712860107e-02,1.364478588104248047e+00,0.000000000000000000e+00,4.605550169944763184e-01,1.564514338970184326e-01,1.068501710891723633e+00,0.000000000000000000e+00,1.793796300888061523e+00,1.236290574073791504e+00,5.773849487304687500e-01,2.548224449157714844e+00,1.083405137062072754e+00,1.178002059459686279e-01,-1.116195082664489746e+00,0.000000000000000000e+00,8.484367132186889648e-01,1.113812208175659180e+00,9.878969192504882812e-01,5.820630192756652832e-01,4.325648546218872070e-01,1.004681587219238281e+00,8.44922e-01
我已經檢查過,沒有數據差異。
有人可以幫我解決這個錯誤信息嗎?
事實上,無論它出現在哪裏,我都只會在這個特定值上出錯。 – Shinchan
然後你的解析器有一個一致的問題(很好!重現性使得調試更加容易)。該文字是完全有效的(後面的數字),手動插入python並檢查自己。該數字被裁剪,這是一個解析問題,不是鑄造問題 –
也感謝您(1)發佈堆棧跟蹤,然後(2)發佈您的數據。使問題更容易回答 –