2013-11-04 38 views
1

我正在寫一些代碼來找到一個網頁的絕對網址:無法找到絕對URL

http://explore.bfi.org.uk/4ce2b69ea7ef3

到目前爲止,我得到的頁面的所有鏈接,並打印絕對URL

下面是代碼的一部分:

Elements hyperLinks = htmlDoc.select("a[href]"); 

    for(Element link: hyperLinks) 
    { 
     System.out.println(link.attr("abs:href")); 
    } 

這很多或網址打印出,就像上述的一個。但是,它似乎也跳過了一些URL。它跳過的是我實際需要的。

這是它沒有變成絕對URL的一個[HREF]元素之一:

<div class="title"><a href="/4ce2b69ea7ef3">Royal Review</a><br /></div> 

它將打印此行,如果我只是打印「鏈接」,但是當我把「ABS:HREF」 ,它只會打印空白。

我是新來的Java和欣賞任何反饋!

回答

1

你不應該使用 「一[HREF]」,用 「a」 代替以下this example

你的情況
Document doc = Jsoup.connect("http://jsoup.org").get(); 

Element link = doc.select("a").first(); 
String relHref = link.attr("href"); // == "/" 
String absHref = link.attr("abs:href"); // "http://jsoup.org/" 

所以:

Elements hyperLinks = htmlDoc.select("a"); 

    for(Element link: hyperLinks) 
    { 
     System.out.println(link.attr("abs:href")); 
    } 
+0

哇感謝,這是非常有用的,我!但是我得到「/ 4ce2b699a9880」我可以把它變成絕對的Url嗎? – user2950150

+0

我現在使用你給我的源代碼設法做到了!謝謝! – user2950150

+0

很高興幫助你:) – alex