2012-08-28 86 views
3

我有一些使用SGML構建的文檔,並且我有一個描述此結構的DTD文件。用於Python 3的SGML解析器?

有人可以推薦一個Python-3兼容庫或模塊來解析這些數據嗎?對於Python 2.x,我的Google-fu似乎變成了SGMLParser,但這當然已經被棄用(並且徹底從Py3k中刪除)。

許多人似乎建議lxml,但由於依賴性問題,這不是我的選擇。

我知道BeautifulSoup非常適合凌亂的標記,但A)最後我聽說它不是py3k兼容的,B)這個內容是結構良好的。

回答

1

BeautifulSoup已棄用。使用替換而不是,這是Py3k兼容: