我試圖讓選擇列表中this page:什麼是正確的xpath來刮這個網頁?
$("#Lastname"),$(".intro"),....
這裏使用xpathSApply
我嘗試:
library(XML)
library(RCurl)
a <- getURL('http://www.w3schools.com/jquery/trysel.asp')
doc <- htmlParse(a)
xpathSApply(doc,'//*[@id="selectorOptions"]') ## I can't get the right xpath
我也試過,但沒有成功:
xpathSApply(doc,'//*[@id="selectorOptions"]/div[i]')
編輯我添加python標籤,因爲我也接受python解決方案。
JavaScript正在運行在此頁上c reate你正在尋找的內容。例如'var w3SelDescriptions = []; w3SelDescriptions.push('id =「Lastname」'的元素');' 您需要從瀏覽器或類似的東西獲取javascript頁面。 – jdharrison
@jdharrison恐怕我不明白你的觀點。你的意思是選擇器是由這個調用創建的:'onload =「w3jQuerySelectorLoad()'? – agstudy
選擇器列表是由一段javascript代碼創建的 – jdharrison