2011-04-11 39 views
2

我試圖創建一個Web工具,可以可視化兩個XML之間的差異。 difflib在創建具有差異的html方面工作得很好,但隨後一些unicode文本出現在XML中,並且生成的html現在包含html編碼的字母。使用Python的Unicode與XML的差異

有沒有其他方法解決這個問題?

+0

你的XML和HTML編碼的字符在你的HTML unicode有什麼問題嗎?爲什麼會阻止你? – JosefAssad 2012-05-07 12:15:15

回答

1

我想你是什麼困擾'html character實體',而不是他們的數字對應。你可以重新映射它們,例如通過支持正則表達式(例如sed)的您最喜愛的cli工具以及unicode e-workersreference中的表格。數字實體編碼可以在html和xml文件中使用。

最好的問候,carsten