2012-10-18 149 views
-1

可能是一個愚蠢的問題,但由於某種原因&未被識別爲&。我從API獲取文本,&打印爲&而不是&。我通過UTF8編碼,但它沒有捕獲它&符號混淆

+3

請,張貼一些代碼(尤其是編碼部分),以便我們可以幫你:) –

+0

你引用的HTML實體,這是很難說你在哪裏「打印」它,以及API調用的結果究竟是什麼。 – Tadeck

+3

看到http://stackoverflow.com/questions/2087370/decode-html-entities-in-python-string –

回答

4

&是&符號的HTML轉義序列。它與字符編碼無關。如果你打開你在瀏覽器中獲取的頁面(如果可能的話),你也會在源代碼中看到它。

1

您可以嘗試使用BeautifulSoup翻譯的HTML Entity names.

from BeautifulSoup import BeautifulStoneSoup 
BeautifulStoneSoup("&",convertEntities=BeautifulStoneSoup.ALL_ENTITIES)