0
我試圖從http://stats.nba.com/team/#!/1610612742/刮掉關於名單數據的數據。到目前爲止,我已經試過RCurl和XML封裝,心中已經試過代碼如下:刮掉NBA.com的數據
library(RCurl)
library(XML)
webpage <- getURL("http://stats.nba.com/team/#!/1610612742/")
webpage <- readLines(tc <- textConnection(webpage));
pagetree <- htmlTreeParse(webpage, useInternalNodes = TRUE)
x <- unlist(xpathApply(pagetree,"//*nba-stat-table_overflow/player",xmlValue))
Content <- gsub(pattern = "([\t\n])",
replacement = " ", x = x, ignore.case = TRUE)
我相信我的xpathApply功能被誤格式化。我應該選擇什麼樣的路徑才能進入名單表?
它看起來像通過JavaScript以某種方式加載數據,這意味着你需要拉動HTML像RSelenium,它可以控制瀏覽器實際運行必要的腳本。 [這是一個例子。](http://stackoverflow.com/a/41497119/4497050)當然,一定要閱讀條款和條件;他們是相當慷慨的,但非常具體的如何使用他們的統計數據。 – alistaire
我很抱歉,這只是一個網上抓取作業的作業 –
沒有道歉的必要;這不是最簡單的頁面。維基百科是一個更容易實踐的網站。 – alistaire