我使用python接收不同編碼的網絡響應,並在網頁上給出我的預期產出應該有相同的如何保持編碼字符是
例:馬克·巴比
最後一個字符應解析html響應後保持不變。
目前我使用下面的代碼爲這個
unicode.join(u'\n',map(unicode,item))
在某些情況下,當沒有特殊編碼,給它拋出以下錯誤: 例:馬庫斯Rygaard,Alberte Blichfeldt,弗萊明奎斯特,穆勒
Traceback (most recent call last):
File "BFICrawl.py", line 20, in <module>
print attrName + " : " + attrValue
File "C:\Python27\LIB\encodings\cp437.py", line 12, in encode
return codecs.charmap_encode(input,errors,encoding_map)
UnicodeEncodeError: 'charmap' codec can't encode character u'\xf8' in position 6
0: character maps to <undefined>
我真的無法找到相同的原因。有沒有其他的方法可以從網頁獲取相同的編碼內容。
請發表您的操作系統和版本,因爲這也可能取決於你在運行的終端和操作系統上。 – snies 2012-04-27 21:39:55