2014-04-04 81 views
0

我將一箇舊的WordPress博客的內容移植到Mezzanine。我被給了一個數據庫的JSON轉儲,並且這些帖子中散佈着特殊字符,如下所示:\x96其他非轉義的html。如何在Python中將u' x96'轉換爲u'–'

如果我手動replace&#斜槓和追加一個分號字符正確呈現

所以\x96–

轉義的UTF-8(十六進制)爲HTML實體(十六進制)

如何在Python中做到這一點?

+2

是否需要是''–?或'–'工作?如果是的話,'u'\ x96'.encode('ascii','xmlcharrefreplace')'就能做到這一點。 – mgilson

回答

1

如果–也是可以接受的,您可以使用:

>>> u'\x96'.encode('ascii', 'xmlcharrefreplace') 
'–' 

這是即使在documentation 叫出來。

(雖然不是很清楚)...

相關問題