dplyr發生變異相交不工作

我有這樣樣本數據幀我試圖找到2列coauthors和nacoauthors之間的交叉使用下面的代碼dplyr發生變異相交不工作

interscout = 
    sample_test %>% 
    mutate(commonauth = intersect(coauthors, nacoauthors))

，我得到這個輸出我不知道爲什麼我無法使用在mutate中獲得常見交集。

理想情況下，最後一行應該是空的，第二行應該只有JAMES M ANDERSON交集。

這裏是結構的代碼。

> dput(sample_test) 
structure(list(fname = c("JACK", "JACK", "JACK"), lname = c("SMITH", 
"SMITH", "SMITH"), cname = c("JACK SMITH", "JACK A SMITH", "JACK B SMITH" 
), coauthors = list(c("AMEY S BAILEY", "JAMES M ANDERSON"), "JAMES M ANDERSON", 
    "JOHN MURRAY"), nacoauthors = list(c("AMEY S BAILEY", "JAMES M ANDERSON" 
), c("AMEY S BAILEY", "JAMES M ANDERSON"), c("AMEY S BAILEY", 
"JAMES M ANDERSON"))), row.names = c(NA, -3L), vars = list(fname, 
    lname), drop = TRUE, indices = list(0:2), group_sizes = 3L, biggest_group_size = 3L, labels = structure(list(
    fname = "JACK", lname = "SMITH"), class = "data.frame", row.names = c(NA, 
-1L), vars = list(fname, lname), drop = TRUE, .Names = c("fname", 
"lname")), class = c("grouped_df", "tbl_df", "tbl", "data.frame" 
), .Names = c("fname", "lname", "cname", "coauthors", "nacoauthors" 
))

來源

2017-05-08 Dinesh

它會拋出一個錯誤因爲mutate正在尋找與完整數據集具有相同輸出長度的東西。你可以使用dply'intersect（sample_test $ coauthors，sample_test $ nacoauthors）之外的相交'，它應該可以工作 –

如果添加rowwise()，讓你的突變列list它會工作：

interscout <- sample_test %>% 
    ungroup() %>% 
    rowwise() %>% 
    mutate(commonauth = list(intersect(coauthors, nacoauthors)))

FWIW如果我不包括rowwise()我得到Error: not compatible with STRSXP

來源

2017-05-09 00:33:58 Nate

謝謝！在這裏取消組合和劃分的作用是什麼？ – Dinesh

'ungroup（）'可能不是必須的，但是它是一種預防措施，因爲你的'dput'描述了一個「groupped_df」。如果一個分組對你的'data_frame'有效，'mutate（）'可以在分組框架內工作，而不是單獨比較每一行，這可能不是你想要的。 'rowwise（）'告訴mutate（）'單獨考慮每一行，這就是你想要進行行內比較的方式，就像這樣。 – Nate

dplyr發生變異相交不工作

回答

相關問題