我使用Python 2.7解析了一大堆網頁,並從網頁中獲取內容,但網頁中包含「」和「」等字符,它們都以某種方式轉換爲「Äô」。這給了我一個內容如下所示的文件(不包括引號):「我認爲它很重要...」寫入文件時出現Python unicode錯誤
使用print()
方法在終端中打印出的字符串很好,但我無法似乎使用print >> file, string
或file.write(string)
獲得相同的效果。顯然這是一個編碼問題,但我沒有找到解決方法。我打開這樣的文件:file = codecs.open("file.txt","w+", encoding='utf-8')
,我使用BeautifulSoup4的getText()
方法爲字符串賦值。有什麼方法可以解決這個問題嗎?
你能給我們提供該頁面的鏈接嗎? – alexanderlukanin13
由於缺乏可重複的代碼,因此不適用。 http://stackoverflow.com/help/how-to-ask –