我正在使用熊貓並導入了兩個csv。熊貓to_csv導出在數據框中給出錯誤的值
DF1是
DF2是
DF2的數據類型是
當我在做在DF1和DF2一些操作:
df3= pd.merge(df1, df2, how='left', on=['Origin City Code', 'DC'])
,然後將其導出到csv
df3.to_csv("test.CSV")
那麼所有的值的下欄「量」的總和與值的總和下的列不匹配原來的df2。事實上,df3的總和現在會更多。我相信由於浮點數的緣故,問題即將出現。但是有什麼辦法可以解決嗎?我已經通過以下鏈接,但我的問題仍未得到答覆。
https://github.com/pydata/pandas/issues/2069
reading and writing csv in pandas changes cell values
Wrong decimal calculations with pandas
下面是代碼的文件我使用:https://www.dropbox.com/s/kjpnhl7qtojes92/sample.rar?dl=0
你有重複的'['出發城市代碼','DC']'df1'中的行?這會導致在合併的DataFrame中存在重複的卷,解釋更大的總和。 – root
@root ..在df1中沒有重複的值。我檢查了 – Ajeet
我並不是說整個重複,只是在'['Origin City Code','DC']'子集,即'df.duplicated(subset = ['Origin City Code','DC']] ).ANY()'。總和是多少?你能提供一個可重複的例子嗎?我無法重現您顯示的數據的錯誤。 – root