2011-12-08 41 views
0

我對基於SAXParser的RSS提要解析器存在一些麻煩。 我擴展了DefaultHandler類,一切都很好,直到今天;我現在有麻煩,因爲飼料文件包括這一行:解析字符「°」時出現SAXException

<description>°</description> 

,所以我得到這樣描述的異常:

org.apache.harmony.xml.ExpatParser$ParseException: At line 102, column 13: not well-formed (invalid token) 

我怎麼能解決這種情況呢?我該怎麼做才能避免這種異常?

回答

0

文章here建議您需要在輸入源上正確設置編碼。從文章的代碼片段給出了以下解決方案,使用適當的編碼數據(這裏給出兩個例子):

InputSource inputSource = new InputSource(is); 
//inputSource.setEncoding("iso-8859-1"); 
inputSource.setEncoding("utf-8"); 
+0

兩個「UTF-8」和「ISO-8859-1」不工作.. 。 – user1012480

+0

xml的第一行應該包含一個頭部和一個可選的編碼。這應該符合你在上面設置的內容。如果沒有,則解析器將默認爲系統編碼。如果您可以在瀏覽器中打開xml源,您將能夠看到編碼。 Windows上的默認編碼是Windows-1521,您也可以嘗試。 – DaveRlz