0
我在我的HTML文件(這是一個右引號)中有’
,我想將它轉換爲文本(如果可能)。將html實體轉換爲文本
我試過使用HTMLParser和BeautifulSoup但沒有成功。
>>> h = HTMLParser.HTMLParser()
>>> h.unescape("'")
u"'"
>>> h.unescape("’")
u'\x92' # I was hoping for a right curly quote here.
我的目標很簡單:把html輸入並輸出所有的文本(沒有任何html代碼)。