當我想用Python中的BeautifulSoup庫解析XML文檔時,我遇到了一些問題。我想解析的XML文檔:解析非標準XML(CDATA標記)
<item>
<title><![CDATA[Title Sample]]></title>
<link /><![CDATA[http://banhada.kr/?cateCode=09&viewCode=S0941580]]>
<time_start>2011-10-10 09:00:00</time_start>
<time_end>2011-10-17 09:00:00</time_end>
<price_original>35000</price_original>
<price_now>20000</price_now>
</item>
正如您在上面看到的,標記有點奇怪。在我看來,(標籤)不是一種立場XML形式,對吧?我怎樣才能解析這種可怕的形式?
哇。感謝您的kandness – user513004
UserWarning:BeautifulStoneSoup類已被棄用。而不是使用它,將特徵=「xml」傳遞到BeautifulSoup構造函數中。 –
更新了我的答案,以使用BeautifulSoup4。 – unutbu