2010-04-06 63 views
1

從網站的內容,我想如何讓從UTF8格式的網站內容,,得到與UTF8格式

我已經寫了下面的代碼是

try { 
     String webnames = "http://pathivu.com"; 

     URL url = new URL(webnames); 

     URLConnection urlc = url.openConnection(); 

     //BufferedInputStream buffer = new BufferedInputStream(urlc.getInputStream()); 
     BufferedReader buffer = new BufferedReader(new InputStreamReader(urlc.getInputStream(), "UTF8")); 

     StringBuilder builder = new StringBuilder(); 

     int byteRead; 

     while ((byteRead = buffer.read()) != -1) 
      builder.append((char) byteRead); 

     buffer.close(); 

     String text=builder.toString(); 

     System.out.println(text); 
    } 
catch (IOException e) 
{ 
    e.printStackTrace(); 

} 

,但我不能得到正確的格式。 ..

感謝,並提前..

回答

1

您的代碼看起來不錯。這裏的問題,這將是在服務器上的數據將無法在UTF-8格式..

+0

這個問題的任何解決方案? – zahir 2010-04-06 05:30:50

+0

請檢查服務器從哪裏得到的內容..你可以提供更多詳細信息 – sreejith 2010-04-06 05:38:46

+0

我可以很容易地得到的內容,如果英文內容, 但其他格式顯示像問號或其他符號... 什麼你想要更多細節? – zahir 2010-04-06 06:14:47

3

的問題可能是您的控制檯或您的System.out不是UTF-8。

  • 嘗試寫這一個文件,而不是
  • 設置通過System.setOut(..)

控制檯流,您可能需要使用-Dfile.encoding=utf-8OutputStreamWriter

+0

或者坐在一個IDE內部時,配置工作區編碼。在Eclipse是*窗口>首選項>常規>工作空間>文本文件編碼*。這一個需要被設置爲UTF-8(1)。 – BalusC 2010-04-06 13:25:35