2012-09-01 52 views

回答

2

問題出在目標頁面。它根本不是完整的。

解析頁面時,JSoup會嘗試修復頁面,並且首先解析內容類型爲「text/html; charset ='iso-8859-1'」(包括單引號)。

然後,它通過這個字符串(用單引號),並使用它來獲得字符集:

Charset.forName("'ISO-8859-1'"); 

其失敗。

問題出在目標頁面。 也許你可以使用這個替代方案,它不會從頁面解析字符集,因爲你明確地將它傳遞給它:

String url = "http://www.design.cmu.edu/community.php?s=3"; 
Document document = Jsoup.parse(new URL(url).openStream(), "ISO-8859-1", url);