2012-03-13 134 views
0

我正在使用Java和SAX從搜索引擎實現RSS搜索功能。然而,某些搜索結果不是完整的,即一些條目的<title>標籤的主體包含&字符而不是&amp;等(例如,比方說,Starsky & Hutch)。java sax解析不正常xml

解析RSS時,我得到一個org.apache.harmony.xml.ExpatParser&ParseException,導致整個搜索中斷並返回任何內容。

我想讓我的解析器解決這些錯誤,就像Firefox的RSS閱讀器一樣。解決這個問題並解析RSS提要的可能性有哪些?

+0

RSS提要解析器如何? http://stackoverflow.com/search?q=%5Bjava%5D+rss+parser – 2012-03-13 17:26:10

+0

如果格式不正確,那麼它不是RSS提要。一個迂腐點,但卻是至關重要的一點。 – skaffman 2012-03-13 17:42:09

+0

@skaffman我同意你的意見。但是這讓我別無選擇,只能放棄這種飼料。太糟糕了,儘管這是他們的錯 – Gabriel 2012-03-13 18:08:08

回答

1

SAX實現通常用於檢測錯誤和拋出異常,並且沒有標準的方法來解決這個問題。我能想到的最合理的事情是在流式傳輸到SAX之前嘗試修補錯誤,如流浪&字符。