2015-02-23 40 views
0

我需要鏈接絕對路徑而不鏈接到文件。我有這個代碼讓我鏈接和一些鏈接丟失。如何獲得沒有文件的絕對URL parh

public class Main { 

public static void main(String[] args) throws Exception { 
    URI uri = new URI("http://www.niocchi.com/"); 
    printURLofPages(uri); 
} 

private static void printURLofPages(URI uri) throws IOException { 
    Document doc = Jsoup.connect(uri.toString()).get(); 
    Elements links = doc.select("a[href~=^[^#]+$]"); 

    for (Element link : links) { 
     String href = link.attr("abs:href"); 
     URL url = new URL(href); 
     String path = url.getPath(); 
     int lastdot = path.lastIndexOf("."); 
     if (lastdot > 0) { 
      String extension = path.substring(lastdot); 
      if (!extension.equalsIgnoreCase(".html") && !extension.equalsIgnoreCase(".htm")) 
       return; 
     } 
     System.out.println(href); 
    } 
} 
} 

此代碼讓我下面的鏈接:

http://www.enormo.com/ 
http://www.vitalprix.com/ 
http://www.niocchi.com/javadoc 
http://www.niocchi.com/ 

我需要得到這個鏈接:

http://www.enormo.com/ 
http://www.vitalprix.com/ 
http://www.niocchi.com/javadoc 
http://www.linkedin.com/in/flmommens 
http://www.linkedin.com/in/ivanprado 
http://www.linkedin.com/in/marcgracia 
http://es.linkedin.com/in/tdibaja 
http://www.linkody.com 
http://www.niocchi.com/ 

感謝很多建議。的

+0

URI類有你需要的一切;你有沒有看過它的javadoc? – fge 2015-02-23 10:09:35

+1

另外,從URI路徑本身,你不能容易地確定這個路徑是否是一個「文件」的「目錄」在所有 – fge 2015-02-23 10:13:31

+0

有沒有什麼好辦法如何檢查它,如果它是文件? – basfot 2015-02-23 10:22:30

回答