0
從一個網頁,我srcaped一個詞「Zápas」。問題在於我的數據中最接近的版本如下所示:在windows-1250編碼之後的Z \ xe1pas。沒有那個str(a)有一些ANSI錯誤。 謝謝你的幫助。編碼斯洛伐克字母,如:ášČé
我嘗試:
def encode(text):
return text.encode('windows-1250')...
...
for cell in row.findAll(['td', 'th']):
cell=encode(cell.get_text().strip())
a.append(cell)
foo.write(str(a)+"\n")
爲什麼你手動編碼而不是讓'foo'處理它? –
對於涉及unicode的任何事情,指定Python 2或Python 3以及(最好)標記非常重要。 – nigel222