的Java得到的所有網頁（網站地圖），任何網站

我想要得到例如爲BBC的網站（bbc.co.uk）網站所有網頁它會得到http://www.bbc.co.uk/news/，http://www.bbc.co.uk/weather/等的Java得到的所有網頁（網站地圖），任何網站

一種方式我可以想到這樣做只是從主頁開始，並收集所有鏈接，併爲主頁上的每個鏈接網頁做相同的集合。基本上最終的目標是爲任何網站生成一個網站地圖。

有沒有人有任何其他解決方案比這更有效？

謝謝。

2014-04-01 JCS

您可以嘗試xpath – Leo

硒可以用來實現相同的

WebDriver driver = new FirefoxDriver(); 
driver.load("http://bbc.co.uk"); 
// get all links from page 
List<WebElement> links = driver.findElements(By.tagName("a")); 
for(WebElement link : links){ 
    // Store link and do something 
}

來源

2014-04-01 10:18:16 xyz

我發現用Java編寫的，你可以在這裏修改免費&開源站點地圖生成器...

Java-Open Source- SiteMap Generator Code

來源

2014-04-01 10:25:51 JayD

此文件的任何文檔？我似乎無法找到提供的鏈接。 – JCS

的Java得到的所有網頁（網站地圖），任何網站

回答

相關問題