我正在通過GET請求參數接收數據。其中一些參數是字符串,並且由於編碼問題我能夠正確顯示它們,所以我很困難。Python中字符編碼的困難
這是我所收到一個例子:
{'id_origen': u'9', 'apellidos': u'\xd1\xe9rez', 'nombre': u'Pimp\xe1m'}
你可以看到,沒有被正確接收的關鍵「apellidos」的值。看來
u'\xd1\xe9rez'
,而不是
Núñez.
我想在一個非常原始的方式來解決這個問題,保換,如「\ XE1」與「A」字符的每次出現,例如。但它也給我帶來了問題。這是我想出的代碼:
tabla = {'\xE1':'á', '\xE9':'é', '\xED': 'í', '\xF3':'ó', '\xFA':'ú'}
logger.info ("Valor del argumento antes del bucle de urldecode: %s" % valor)
for k, v in tabla.iteritems():
if k in valor:
valor.replace(k, v)
當然,它並不像我預期的那樣工作。
對於我正在接受的字符編碼類型,恰當的治療方法是什麼?