我使用sax解析器來解析XML作爲字符串在我的應用程序中。當我的代碼發送HTML正文作爲字符串時,薩克斯解析器卡住更長時間(超過5小時)。Sax解析器被卡住當解析Html爲字符串時
頁面源url:「http://www.cityam.com/taxonomy/term/1/all/feed」,我想分析。 此網址提供HTML頁面而不是XML。 如何處理這類問題或如何從適當的例外中從我的saxParser中解脫出來。 我的代碼是在這裏
public List<RssEntry> parseDocument(String body) {
// expected body is xml but getting stuck when get body of html page.
SAXParserFactory factory = SAXParserFactory.newInstance();
try {
SAXParser parser = factory.newSAXParser();
XMLReader reader = parser.getXMLReader();
parser.parse(new ByteArrayInputStream(body.getBytes("UTF-8")), this);
}
some catch block
請幫me.Thanks
這很有可能是HTML不是有效的XML。這可能是問題嗎? – 2013-03-08 11:27:31
你可以擴展你卡住的意思嗎?您的Handler中的回調實際上是否被調用?是否有任何異常被拋出? – DaveJohnston 2013-03-08 11:29:25
@ sven - 但如何從這裏離開,如果html無效 – Nitendra 2013-03-08 11:30:18