2016-11-13 48 views
0

我有一些地方的字符編碼的HTML字符串:如何讓BeautifulSoap解析編碼字符,如「 u003C」?

\u003C\/style\u003E\u003Cdiv\u003E\u003Cdiv style=\"position:relative;background: ...... 

我希望能夠與BeautifulSoap解析它。有沒有一種簡單的方法可以將所有這些編碼字符轉換爲BeautifulSoap支持並向其提供結果字符串的fromat?

+0

它是UTF-8中的字符。也許你只需要'解碼()'它。 – furas

+0

@furas,如何?...... – Kumakaja

+0

顯示更多信息:如何獲取此字符串,如何在屏幕上顯示它(也許它只是控制檯問題,而不是HTML),它是字符串還是字節。 – furas

回答

0

有沒有必要這樣做。 Beautifulsoup可以正確處理它。 我跑的HTML字符串,它的工作原理。

html string test