如何使用R讀取HTML表中的內容

我正在嘗試閱讀每個月都會更新一次的表格，並且我已經四處搜索但無法修復它，請幫助，謝謝！如何使用R讀取HTML表中的內容

library(XML) 
MEItable <- htmlTreeParse("http://www.esrl.noaa.gov/psd/enso/mei/table.html") 
pre <- MEItable$children$html 
pre <- unlist(pre[["body"]][names(body[["body"]]) == "pre"])

來源

2014-09-19 Rosa

是的，我做了，並得到一個空的表... – Rosa 2014-09-19 17:25:13

看起來你並不真的需要XML閱讀該網頁。實際上，使用read.table的參數會更簡單。這可能也會更快，因爲沒有任何xml/html文檔正在處理。

> URL <- "http://www.esrl.noaa.gov/psd/enso/mei/table.html" 
> rt <- read.table(URL, skip = 12L, nrow = 65L, fill = TRUE, header = TRUE) 
> head(rt, 3)[1:8] 
# YEAR DECJAN JANFEB FEBMAR MARAPR APRMAY MAYJUN JUNJUL 
# 1 1950 -1.018 -1.143 -1.290 -1.061 -1.416 -1.372 -1.332 
# 2 1951 -1.069 -1.193 -1.208 -0.439 -0.305 0.438 0.715 
# 3 1952 0.408 0.135 0.086 0.257 -0.289 -0.657 -0.255

來源

2014-09-19 17:53:19

謝謝，這是我需要的！ – Rosa 2014-09-19 20:16:38

如何使用R讀取HTML表中的內容

回答

相關問題