我正在嘗試從URL中讀取數據,然後輸出結果。嘗試從URL讀取(使用Java)會在某些事件中產生亂碼
BufferedReader in = new BufferedReader(
new InputStreamReader(new URL("http://somesite.com/").openStream(), "UTF-8"));
String s = "";
while ((s=in.readLine())!=null) System.out.println(s);
in.close();
它在大多數時間都很有效,並打印網站的來源。 但是,我的問題是,在特定的網站上,而不是源代碼,它會打印出亂碼,如符號和其他不尋常的字符。
是否有一些屬性會因網站而異,從而影響閱讀方式?該頁面在Firefox中加載得很好,我可以在那裏查看源代碼,沒有任何問題。如果firefox可以訪問源代碼,我應該可以;我只是不知道它爲什麼不工作...
編輯:添加「UTF-8」到InputStreamReader。所有奇怪的字符現在都是問號...仍然不能正常工作...
有一個*亂碼*標籤?! – razlebe 2011-03-04 00:39:36
你能舉出一個這樣的URL的例子嗎? – razlebe 2011-03-04 00:41:59