我嘗試從「latin1」中導入數據庫編碼的數據,更改爲「unicode」並將它們導入到我的應用中。通常這是沒有問題的。但現在我有一個新的數據與一個奇怪的字符字段=「\ x17」用Python替換或刪除傳輸塊的結尾2.7
我如何處理這在Python中?
我現在所做的是替換這些數據的功能。但我認爲有更好的方法,那麼這個:
def replace_problem_characters(self, text):
replace_store = {u"\x17" : ""}
for key, value in replace_store.items():
if key in text:
text = text.replace(key, value)
return text
[Check this out](http://stackoverflow.com/questions/2672326/what-does-a-leading-x-mean-in-a-python-string-xaa)你確定你沒有需要這些數據? – Priyank
在這種情況下,是的。因爲它是一個人的名字,我可以正確地在Web界面中看到。它來自立陶宛人。也許他從本地編碼的文本文檔複製和粘貼? – oxidworks
@oxidworks \ x17是一個控制字符,以大多數編碼存在,包括ascii。不可能複製和粘貼。也許他的IME允許輸入控制字符... –