我有一個文件,我正在解析自己。每當我發現了一個「<」或「>」我分割字符串,像這樣:解析包含文件的字符串時出錯
xml = file.split("[<>]");
這會給我的標籤,數據和結束標記。
一旦完成,我確定它是什麼類型的標籤,並以不同的方式處理它。如果它是一個物品標籤,它有一個描述。像這樣:
<description>
<![CDATA[
<img width="460" height="259" src="http://www.cbc.ca/gfx/images/news/topstories/2012/03/28/hi-parliament-stop-852-7931-6col.jpg"><br/><p>Finance Minister Jim Flaherty's budget will take the shine off what critics call MPs' gold-plated pensions, reports Greg Weston for CBC News.</p>
]]>
</description>
這裏的問題是,它會分裂的所有「<」和「>」這樣的描述,我正在尋找丟失的部分。
我該如何解決描述和其他我正在搜索的標籤,其中包含多個「<」和「>」,我不在乎? (那些不是圍繞開口標記和結束標記?
如果這實際上是XML,爲什麼不使用XML解析器? – 2012-03-29 05:44:30
我想學習如何做我自己......通過它思考和分析它自己 – BigBug 2012-03-29 05:45:27
WY不要試圖一個標準的XML解析器? – Nishant 2012-03-29 05:46:13