2011-11-08 61 views
0

我解析下面的XML文件:如何逃避SAX特殊字符解析

<description> 
    <p> 
    <a href="http://news.yahoo.com/jessica-chastain-talks-princess-diana-biopic- 164102608.html"> 
    <img src="http://l3.yimg.com/bt/api/res/1.2/zD3Iwxezk8JVGQwhow7y4Q--/YXBwaWQ9eW5ld3M7Zmk9ZmlsbDtoPTg2O3E9ODU7dz0xMzA-/http://media.zenfs.com/en_us/News/Reuters/2011-11-07T171906Z_01_BTRE7A61C3Y00_RTROPTP_2_FILM-US-JESSICACHASTAIN.JPG" 
     alt="photo" 
     align="left" 
     title="Actress Chastain poses for photographers as she arrives on the "Wilde Salome" red carpet at the 68th Venice Film Festival" border="0" /> 
    </a>NEW YORK (TheWrap.com) - Jessica Chastain may not win Oscar gold this year, but it appears she will wear a crown. 
    </p> 
    <br clear="all"/> 
    </description> 

我使用SAX解析器,並試圖得到IMG標籤,title屬性裏面的數據。但由於在文字我特別char 「野生莎樂美」我越來越ExpatParser例外。 您能否讓我知道如何解決這個問題?

+0

發佈SAX解析代碼。 –

+2

此XML文件不是正確的XML文件。引號應該轉義爲"。這不是應該修改的SAX解析,而是生成XML的程序。 –

+1

報價如何逃脫? – AndroGeek

回答

1

該XML無效。屬性值不應包含引號(")。生成它的程序應該用&quot;替換內部的"字符。

如果您將&quot;打印到網頁上,瀏覽器將在其位置上自動顯示"-字符。

+1

我從網上獲取內容並將其寫入xml文件。 – AndroGeek

+0

在將它寫入xml文件之前,您應該避免使用引號。 – Lycha