我對R相當陌生,在從福布斯網站提取數據時遇到問題。R中的URL問題
我的當前的功能是:
URL =
http://www.forbes.com/global2000/list/#page:1_sort:0_direction:asc_search:_filter:All%20industries_filter:All%20countries_filter:All%20states
數據= readHTMLTable(URL)
然而,當我改變頁面#在url從1到2(或以任何其它數字),所拉出的數據與第1頁中的數據相同。出於某種原因,R不會從正確的頁面提取數據。如果您手動將鏈接粘貼到具有特定頁面的瀏覽器中,則可以正常工作。
有沒有人有一個想法,爲什麼發生這種情況?
謝謝!
數據正在通過javascript加載,並且不在從服務器發送的頁面的實際HTML中。如果你需要一個可以運行javascript的抓取方法,試試RSelenium包。 – MrFlick 2015-02-11 21:46:44
太好了。我會嘗試RSelenium軟件包。謝謝! – 2015-02-12 18:23:26