我創建了一個基於'HTMLParser'的子類來提取html內容。每當我有性格裁判如解碼html內容和HTMLParser
' ' '&' '–' '…'
我想要的
' ' (space), '&', '-', '...', and so on.
什麼是一些簡單的字符裁判的轉化爲自己的正確表示最好的辦法他們的英國同行來替代它們?
我的文字是類似於:
Some text goes here&after that, 6:30 pm–8:45pm and maybe
something like …
我想將其轉換爲:
Some text goes here & after that, 6:30 pm-8:45pm and maybe
something like ...
[在Python中將XML/HTML實體轉換爲Unicode字符串](http://stackoverflow.com/questions/57708/convert-xml-html-entities-into-unicode-string-in-python) – geoffspear