我正在從網頁中讀取網頁源代碼,然後解析該源代碼中的值。 那裏我正面臨特殊字符的問題。用特殊字符閱讀Python網頁源代碼
在我的python控制器文件iam中使用# -*- coding: utf-8 -*-
。 但我讀這是使用charset=iso-8859-1
網頁源所以,當我讀不指定它拋出錯誤的任何編碼爲UnicodeDecodeError: 'utf8' codec can't decode byte 0xfc in position 133: invalid start byte
當我使用string.decode("iso-8859-1").encode("utf-8")
則分析數據沒有任何錯誤的頁面內容。但它顯示的值是'F \ u00fcnke'而不是'Fünke'。
請讓我知道我可以如何解決這個問題。 我將不勝感激任何建議。
嘗試打印'u「F \ u00fcnke」' –
Python ** 2 **或** 3 **? – Torxed
Python 2.7。並嘗試unicode()它顯示相同。 – Pradeeshnarayan