0
我遇到了HtmlUnit解析器的問題,我試圖從網站中抓取一些XML(使用網站的API),對結果XML進行快速解析,然後將XML保存到文件中(所有內部API的權利)。 (sample content)如何爲HtmlUnit XML解析器定義一個新的實體?
不幸的是,網站中的一些請求頁面的返回實體¿
,雖然這是一個有效的HTML實體的HtmlUnit是分析過程中的與消息拋出一個異常:
實體「iquest 「被引用,但未被宣佈。
如何將iquest
定義爲有效實體?
不夠公平。我希望能夠截取流並使用HtmlUnit解析器,而不是我正在接受的內容在這些無效的實體被剝離的情況下,在HU框架之外解析它。 – 2010-06-28 18:56:06