2017-07-27 58 views
0

我使用rvest來抓取網絡數據。 我從一個網站下面的CSS代碼:從rvest的Scrape標題屬性

<abbr class="intabbr" title="2.856.890">2,9M</abbr> 

我湊與

library(rvest) 
library(dplyr) 
n <- read_html("https://www.last.fm/de/music/Fang+Island") 
n %>% 
html_node("abbr") %>% 
html_text() 

這個數據這給了我「2M」,但我想獲得的是「2.856.890 」。

我不是很瞭解CSS:是否可以通過更改html_node()中的表達式來獲取我想要的信息?

This post暗示這是不可能的,但this one暗示它可能是可能的,因爲它彈出作爲頁面上的工具提示?

回答

1

使用html_attr獲得標籤的屬性:

n %>% 
    html_node("abbr") %>% 
    html_attr("title")