2
R中是否有一種方法可以列出(查找)給定網頁的所有鏈接? 我想輸入一個URL併產生一個來自該站點的所有鏈接的目錄樹。目的是找到相關的子頁面進行刮擦。R中的鏈接檢查器
這裏是SO上的類似問題的鏈接,但沒有R解決方案。謝謝。
Link here to similar question on SO
沒有與Linkchecker的建議解決方案,但了Python下運行,有R內部的東西嗎?
R中是否有一種方法可以列出(查找)給定網頁的所有鏈接? 我想輸入一個URL併產生一個來自該站點的所有鏈接的目錄樹。目的是找到相關的子頁面進行刮擦。R中的鏈接檢查器
這裏是SO上的類似問題的鏈接,但沒有R解決方案。謝謝。
Link here to similar question on SO
沒有與Linkchecker的建議解決方案,但了Python下運行,有R內部的東西嗎?
我覺得rvest
可以做你在找什麼...
library("rvest")
# some url with a bunch of links...
url <- "http://www.drudgereport.com"
url %>% html %>% html_nodes("a") %>% xml_attr("href")
這不是SO因爲它不是關於編程的一個很好的問題。但你應該檢查網絡任務視圖:http://cran.r-project.org/web/views/WebTechnologies.html - 應該有你需要的一切。 – bdecaf