-1
我正在嘗試在SPSS中編寫語法來修改值。當我嘗試閱讀我的數據集,它可以讀取第243項,但失敗了讀出錯誤:使用python讀取SPSS數據集時出現UnicodeDecodeError錯誤
UnicodeDecodeError: 'utf8' codec can't decode byte 0xc3 in position 253: unexpected end of data
我的代碼:
BEGIN PROGRAM.
import json, re, spss
spss.StartDataStep()
datasetObj = spss.Dataset()
for i in range(len(datasetObj.cases)):
print datasetObj.cases[i,0]
spss.EndDataStep()
END PROGRAM.
我如何可以讀取當前數據集沒有錯誤?
Unicode的 「碼點」 A與代字號(Ã)是'U + 00C3'。但是,OP的錯誤表示0xc3是部分十六進制的UTF-8編碼。去掉'0x',你剩下'c3';不是一個字符本身。 UTF-8編碼的Ã爲「C383」或更好:「0xC3 0x83」。同樣,大寫O與中風(Ø)是'0xC3 0x98'。結論:一個UTF-8代碼「0xC3」後面總是跟着另一個代碼。只是'0xC3'不是字符,所以不能被解碼。 '0xC3'用於擴展拉丁字母集。 [此列表](http://www.fileformat.info/info/charset/UTF-8/list.htm)很好參考。 –