2012-09-17 91 views
0

我想解析使用Jsoup的鏈接。它工作正常,但是當我傳遞參數鏈接,看起來像「http://translate.google.com」(包含多個點)錯誤生成。Jsoup連接到鏈接

public class HtmlProcessor { 

    public String[] getLinks(String url) throws IOException { 

     Vector <String> hrefs = new Vector <String>(); 

     try { 

      Document doc = Jsoup.connect(url).get(); 
      Elements links = doc.getElementsByTag("a"); 


      for (Element link : links) { 

       hrefs.add( link.attr("href")); 
      } 
     } catch (ConnectException ex) { 
      System.out.println(ex.getMessage()); 
     } 

     return hrefs.toArray(new String [hrefs.size()]);  
    } 
} 
+0

'httt'是一個錯字嗎? –

+0

對不起,是的,它是 –

+0

請你能顯示一些代碼嗎? – Hbcdev

回答

0

我試圖進入http://translate.google.com,並出現了用戶代理錯誤。嘗試這個;它爲我解決了這個問題:

Document doc = Jsoup 
     .connect(url) 
     .userAgent("Mozilla/5.0 (Windows NT 6.1; WOW64; rv:17.0) Gecko/17.0 Firefox/17.0") 
     .get(); 
+0

此解決方案有效,謝謝) –

+0

好聽:)如果你喜歡它,請選擇它作爲最佳答案! – 2012-09-18 14:06:40