2016-05-12 55 views
1

我有一個名爲base_table的數據框,其中有大量的311數據和URL指向每個調用的更廣泛描述。將rvest管道應用到數據幀

我想創建一個名爲case_desc的新變量,每個URL有一系列的rvest函數。

base_table$case_desc <- 
         read_html(base_table$case_url) %>% 
          html_nodes("rc_descrlong") %>% 
          html_text() 

但是這不起作用,因爲我認爲我現在無法調整的明顯原因。我試過玩功能,但似乎無法指定正確的格式。

任何幫助將會很棒!謝謝!

回答

2

它不起作用,因爲read_html不能使用URL向量。如果你給它一個向量它會拋出一個錯誤...

> read_html(c("http://www.google.com", "http://www.yahoo.com")) Error: expecting a single value

你可能必須使用apply功能...

library("rvest") 
base_table$case_desc <- sapply(base_table$case_url, function(x) 
          read_html(x) %>% 
          html_nodes("rc_descrlong") %>% 
          html_text()) 
+0

這是完美的,製作的第一次嘗試! – michaelcata