2013-07-26 32 views
1

我試圖用Jsoup庫解析網頁。但是因爲它的地址就像主機和端口一樣(http://host:port)(Stackoverflow不允許寫入確切的東西)Jsoup拋出異常並且不解析頁面。Java(Jsoup):如何解析http://主機:端口

這裏是頁地址:

這裏是異常日誌:

org.jsoup.HttpStatusException: HTTP error fetching URL. Status=-1, URL=http://sunucu2.radyolarburada.com:5000/ 
    at org.jsoup.helper.HttpConnection$Response.execute(HttpConnection.java:435) 
    at org.jsoup.helper.HttpConnection$Response.execute(HttpConnection.java:410) 
    at org.jsoup.helper.HttpConnection.execute(HttpConnection.java:164) 
    at org.jsoup.helper.HttpConnection.get(HttpConnection.java:153) 
    at Tester.getSong(Tester.java:136) 
    at Tester.main(Tester.java:150) 
+0

#2不允許我右邊的鏈接這就是爲什麼stacktrace有點不同 – user2604150

+0

將它粘貼到不同的行上,我會爲你編輯並將它們鏈接起來。你可以這樣做:「http colon // www dot example dot org colon 8080」。 – acdcjunior

+0

@acdcjunior好的我編輯了代碼 – user2604150

回答

2

包括在你Jsoup請求userAgent

Document document = Jsoup.connect("http://sunucu2.radyolarburada.com:5000/") 
          .userAgent("Mozilla/5.0 (Windows NT 5.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/27.0.1453.110 Safari/537.36") 
          .timeout(0).followRedirects(true).execute().parse(); 
     System.out.println(document.html()); 
+0

非常感謝你現在工作得很好! – user2604150