某些頁面的內容中包含HTML特殊字符,但它們顯示爲方塊(未知字符)。下載頁面中的HTML字符不能正確顯示
我該怎麼辦?
我可以將包含carachters的字符串轉換爲另一種格式(UTF-8)嗎?它發生在從InputStream到String的轉換中。我真的不知道是什麼原因造成的。
public HttpURLConnection openConnection(String url) {
try {
URL urlDownload = new URL(url);
HttpURLConnection con = (HttpURLConnection) urlDownload.openConnection();
con.setInstanceFollowRedirects(true);
con.connect();
return con;
} catch (Exception e) {
return null;
}
}
private String getContent(HttpURLConnection con) {
try {
return IOUtils.toString(con.getInputStream());
} catch (Exception e) {
System.out.println("Erro baixando página: " + e);
return null;
}
}
page.setContent(getContent(openConnection(con)));
你能否包含你當前的代碼? – eggyal 2011-05-07 13:24:45