2016-02-23 109 views
0

我試圖用rvest軟件包來抓取一組網頁。它適用於大部分的網頁,但我可以用rvest我無法使用rvest獲得價值

url <- "http://www.trademe.co.nz/Browse/CategoryAttributeSearchResults.aspx?search=1&cid=5748&sidebar=1&132=FLAT&selected135=5&134=1&135=5&216=0&216=0&217=0&217=0&153=&122=0&122=0&123=0&123=0&59=25000&59=35000&178=0&178=0&sidebarSearch_keypresses=0&sidebarSearch_suggested=0" 
rent_html <- read_html(url) 

html_nodes(rent_html, "div.property-card-subtitle") # it works 
html_nodes(rent_html, "div.list-view-card-price") # but this is not works 

我想在網絡上的租金價格的價值得到租賃費的信息,但我不知道如何訪問它。

+0

'html_nodes(rent_html, 「div.property卡價格容器」)'? –

+0

我只想獲得[div.list-view-card-price] inner [div.property-card-price-containe]的信息。這是不可能的嗎? –

回答

0

你可以嘗試

rent_prices <- rent_html %>% html_nodes("div.property-card-price") %>% html_text() 
#> rent_prices 
# [1] "$270 per week" "$250 per week" "$350 per week" "$300 per week" $350 per week" "$290 per week" 
# [7] "$350 per week" "$250 per week" "$330 per week" "$350 per week" "$330 per week" "$265 per week" 
#[13] "$300 per week" "$300 per week" "$340 per week" "$350 per week" "$250 per week" "$325 per week" 
#[19] "$320 per week" "$310 per week" "$300 per week" "$350 per week" "$270 per week" "$320 per week" 
#[25] "$350 per week" "$295 per week" "$260 per week" "$305 per week" "$285 per week" "$320 per week" 
#[31] "$340 per week" "$350 per week" "$300 per week" "$290 per week" "$330 per week" "$285 per week" 
#[37] "$290 per week" "$270 per week" 
+1

哇!有用!!你如何找到* property-card-price *?我無法在html代碼中找到它。 –

+0

你能解釋一下更多細節嗎?我也使用Firefox檢查器選項,但我仍然無法找到** property-card-price **。價格是** div.list-view-card-price **設置的,正如我上面所說的。 –

+0

您可能處於該頁面的「列表視圖」模式。點擊頁面右上方有四個方塊的圖標,切換到「圖庫視圖」模式。那麼它不應該很難找到。 – RHertel

0

您引用的URL不包含列表值;你已經點擊了列表選項來達到目的。將&v=List添加到URL中,然後

library(rvest) 
url <- "http://www.trademe.co.nz/Browse/CategoryAttributeSearchResults.aspx?search=1&cid=5748&sidebar=1&132=FLAT&selected135=5&134=1&135=5&216=0&216=0&217=0&217=0&153=&122=0&122=0&123=0&123=0&59=25000&59=35000&178=0&178=0&sidebarSearch_keypresses=0&sidebarSearch_suggested=0&v=List" 
rent_html <- read_html(url) 
html_nodes(rent_html, "div.list-view-card-price") 

的作品。

+0

感謝喬納森,但它的結果並不完美,代表價格與日期在一起。沒有日期,沒有辦法只訪問價格價值嗎?或者我應該再次提取它的信息? –

+0

如果你想對它做額外的處理,那麼你可以做到這一點。 'html_nodes'提取整個元素。 –