對此有很多問題和修復,但沒有一個似乎適用於我。 我的問題是我正在閱讀一個帶有字符串的文件並將每行加載到數據庫中。在Python中加載到數據庫的隱形Unicode字符
在文件中它看起來像普通文本,而在數據庫中它是作爲unicode空間讀取的。我試着用一個空間和類似的選項替換它,但都沒有工作。
例如,在文本文件中的字符串將是這樣的:
The abrupt departure
插入數據庫之後,它看起來像:
The abrupt departure
當我試圖在運行數據查詢DB,它看起來像:
"The abrupt\xc2\xa0departure"
我試過如下:
if "\xc2\xa0" in str:
str.replace('\xa0', ' ')
str.replace('\xc2', ' ')
print str
上面的代碼打印字符串等:
The abrupt departure
但同時插入回DB,但它仍然是相同的。
任何幫助表示讚賞。
' str.replace()'不會對字符串做任何事情。 –