2012-03-15 74 views
0
> from BeautifulSoup import BeautifulSoup str = '<p><input></input></p>' 
> BeautifulSoup(str, convertEntities=BeautifulSoup.HTML_ENTITIES) 
> <p><input /></p> 

爲什麼輸出會遺漏標記?它應該打印<p><input></input></p>,但它爲什麼轉換爲<p><input /></p>BeautifulSoup解析缺少標記的輸入

回答

0

標記<input /><input></input>的有效縮寫。這對於HTML和XML來說是正確的。你可能會說服BeautifulSoup輸出擴展版本,但我不明白你爲什麼要這樣做。

+0

是的,我根據解析而不是改變內容。 – zsong 2012-03-15 14:30:35

+0

請澄清。你想讓BeautifulSoup精確地複製輸入嗎? – krlmlr 2012-03-15 15:33:15