2017-07-27 16 views
0

我有一個很大的Excel電子表格,我試圖解析到Python2.7和熊貓0.19.1插入數據到一個MySQL數據庫。作爲其中的一部分,一些單元格包含字符串「N/A」。不幸的是,熊貓似乎無法解析「N/A」,而是輸入nan。當在字符串周圍包含單引號或雙引號時,pandas將它分別導入爲「」N/A「」和「N/A」,並且與我的數據不匹配。無法從Python 2.7中的.XLSX解析字符串「N/A」與熊貓

有什麼方法可以在不修改現有數據的情況下讀取字符串「N/A」嗎?

MWE如下,包括鏈路測試數據文件在GitHub上:

import pandas as pd 
loadData = pd.ExcelFile("testData.xlsx") 
testData = loadData.parse("Sheet1") 

for row in testData.itertuples(index=True, name='testTuple'):  
    if getattr(row, "Value") == "N/A": 
     print(row) 

鏈接到測試數據文件:https://github.com/quacksawbones/testData/blob/master/testData.xlsx

(NB:在計算器上首先的問題請讓我知道,如果我錯過了什麼或需要了解更多信息)

回答

0

根據我對你的問題的理解你想與「N/A」,以取代NaN的,如果你想要這個,你可以使用fillna方法,

df=df.fillna('N/A') 

如果這不是你需要解釋我說清楚你想要什麼....

+0

嗨穆罕默德, 我希望能夠從我的電子表格改爲「N/A」直接把它解釋作爲字符串「N/A」而不是NaN。但我認爲我可以將其用作解決方法。謝了哥們 :) –