1
我想從這個site讀取遊戲數據,並使用XML封裝這樣做:readHTMLTable倒塌span元素
library(XML)
url <- 'http://scores.nbcsports.msnbc.com/cbk/teamstats.asp?team=1115&report=schedule'
raw.schedule <- readHTMLTable(url, which=2)
的問題是,所有的HTML日期列的<span>
元素都摺疊起來。
R> raw.schedule$Date[1]
[1] "11/142:30 PM PT3:30 PM MT4:30 PM CT5:30 PM ET10:30 PM GMT6:30 PM 北京时间3:30 PM MST5:30 PM EST"
理想我想本身如剛纔的日期元素:
R> raw.schedule$Date[1]
[1] "11/14"
我已經試過rvest包,但我有同樣的問題。是否可以讀取此表並保持元素分離,或只選擇第一個元素?