我試圖從擁有多個表的網頁上刮表。我想從https://www.census.gov/geo/reference/ansi_statetables.html獲得「美國各州和哥倫比亞特區的FIPS代碼」表。我認爲XML::readHTMLTable()
是正確的道路要走,但是當我嘗試下面我得到一個錯誤:找到html表名並在R
url = "https://www.census.gov/geo/reference/ansi_statetables.html"
readHTMLTable(url, header = T, stringsAsFactors = F)
named list() Warning message: XML content does not seem to be XML: ' https://www.census.gov/geo/reference/ansi_statetables.html '
這並不奇怪,當然,因爲我不給函數的任何指示其中表我想讀。我已經在「檢查」中挖了很長一段時間,但我沒有連接點如何更精確。似乎沒有類似於我在文檔或SO上找到的其他示例的表名或類。思考?
我用'readHTMLTable(RCurl :: getURL(url),...)'得到了它 –