2015-05-14 24 views
2

R中是否有一種方法可以列出(查找)給定網頁的所有鏈接? 我想輸入一個URL併產生一個來自該站點的所有鏈接的目錄樹。目的是找到相關的子頁面進行刮擦。R中的鏈接檢查器

這裏是SO上的類似問題的鏈接,但沒有R解決方案。謝謝。

Link here to similar question on SO

沒有與Linkchecker的建議解決方案,但了Python下運行,有R內部的東西嗎?

+0

這不是SO因爲它不是關於編程的一個很好的問題。但你應該檢查網絡任務視圖:http://cran.r-project.org/web/views/WebTechnologies.html - 應該有你需要的一切。 – bdecaf

回答

3

我覺得rvest可以做你在找什麼...

library("rvest") 
# some url with a bunch of links... 
url <- "http://www.drudgereport.com" 
url %>% html %>% html_nodes("a") %>% xml_attr("href")