2016-03-05 36 views
1

中的html_nodes定義XPATH值作爲變量,我需要將該XPATH值定義爲html_nodes中的變量。以便我可以遍歷許多XPATH。當我在外面定義XPATH時,它會拋出錯誤(例如,當xpath = // * [@ id =「banner」])時出現錯誤。能否請你幫忙。 我的代碼:如何使用R(rvest)在網頁報廢時使用R

xpath <- as.character('//*[@id="title-overview-widget"]') 
     name <- lego %>% 
     html_nodes(xpath) %>% 
     html_text() 
Error Message : Error in tokenize(css) : Unexpected character '/' found at position 1 

回答

3

html_nodes有三個參數:文件,CSS選擇器,和一個XPath選擇。通過在%>%鏈中使用它,您將填充文檔的第一個參數,但是然後您將設置作爲css選擇器的第二個參數(這就是錯誤消息與CSS相關的原因),而不是xpath選擇器。您應該使用命名參數來解決此問題

name <- lego %>% 
     html_nodes(xpath=xpath) %>% 
     html_text() 
+0

非常感謝MrFlick。現在它工作正常。 – Solomon