我無法弄清楚爲什麼下面的代碼沒有返回xpath
指定的信息。使用rvest返回表的後代
我想選擇在頁面的'核心問題'部分找到的計數數據。我想讓它在第一個問題的表格中工作,然後打算將其擴展爲對頁面上的每個問題/表格執行相同的操作。不幸的是,我可以用它來拉下我感興趣的表格部分。我想象的答案涉及指定我感興趣的< tr>節點的子節點,即多個< td>標籤,但我嘗試這樣做繼續失敗。任何人都可以幫助我指定我感興趣的部分表格嗎? (獎勵積分,如果它可以爲網頁上的所有十張桌子進行!)
library(rvest)
detailed <- html("https://www.deakin.edu.au/evaluate/results/old/detail-rep.php?schedule_select=1301&faculty_select=01&school_select=0104&unit_select=MIS202&location_select=B")
q1 <- detailed %>%
html_nodes(xpath='//*[@id="main"]/div/div/form/fieldset[2]/table[1]/tbody/tr/td[2]/div/table/tbody/tr[5]') %>%
html_table(header = TRUE, fill=TRUE)
當我去祖先表它拉低信息,但它是非常混亂和難以解釋。當我嘗試指定此表中的元素時,我無法提取信息。有人能夠向我解釋爲什麼table[1]
的後代不被提取?這裏是代碼下拉table[1]
:
q1 <- detailed %>%
html_nodes(xpath='//*[@id="main"]/div/div/form/fieldset[2]/table[1]') %>%
html_table(header = TRUE, fill = TRUE)
究竟這裏有什麼期望的輸出? 'html_table'函數假定你傳入一個'table'節點。如果您開始選擇表格中更深的元素,則不會起作用。 – MrFlick