我希望能夠基於它的id包裝div。例如,給定下面的HTML:使用python函數包裝html
<body>
<div id="info">
<div id="a1">
</div>
<div id="a2">
<div id="description">
</div>
<div id="links">
<a href="http://example.com">link</a>
</div>
</div>
</div>
</body>
我想寫一個Python函數,它接受一個文件,一個id,和選擇。並且將給定的id
包裝在給定document
中的div
中,類別或編號爲selector
。例如,可以說,上面的HTML是一個變量doc
wrap(doc,'#a2','#wrapped')
將返回以下HTML:
<body>
<div id="info">
<div id="a1">
</div>
<div id="wrapped">
<div id="a2">
<div id="description">
</div>
<div id="links">
<a href="http://example.com">link</a>
</div>
</div>
</div>
</div>
</body>
我看了一些XML解析器和Python的HTMLParser,但我沒有發現任何東西這使我不僅能夠獲取特定標籤內的所有內容,還能夠附加字符串並輕鬆編輯文檔。如果一個人不存在,那麼對此有什麼好的方法?
您是否嘗試過'BeautifulSoup'? – zhangyangyu
是啊,BeautifulSoup岩石! – ElmoVanKielmo
我寧願不使用BeautifulSoup,因爲它只是在我正在編寫的模塊中的一個快速的東西,我不想導入這樣大小的東西,我甚至不知道如何去做這件事beautifulSoup,但如果真的沒有別的辦法,我會檢查一下 –