2016-04-15 31 views
-1

我試圖提取使用rvest從爛番茄Rvest:爲什麼下面的XPath返回空列表

我用下面的代碼的標題:

urlhtml<-read_html("http://www.rottentomatoes.com/browse/opening/") 
df<-html_text(html_nodes(urlhtml,xpath="//*[@id='movies-collection']/div/div/div[2]/a")) 

xpath從谷歌瀏覽器,從而派生我相信這是正確的,但是,它返回空列表...我無法弄清楚什麼是錯的。

任何人都可以幫忙嗎? 非常感謝

+0

確定的元素是存在的文檔中,你獲取或他們可以動態添加後來的JavaScript? –

+0

我不是網絡編程方面的專家,但我確實看到了HTML檢查中的元素,所以我相信他們不使用javascript – Aiji

+0

@RogerLindsjö,有無論如何我可以檢查這種情況,如果它是由javascript動態添加的?如果是這樣的話,我能做些什麼來刮取數據?你能分享你的知識嗎? – Aiji

回答

0

謝謝大家,原來像@RogerLindsjö說,我需要一個JavaScript首先解析HTML和使用phantomjs合作[R報廢

相關問題