0
希望有人可以提供幫助。我在R中有很多ortholog映射,這被證明是非常耗時的。我已經在下面發佈了一個示例結構。顯而易見的答案,例如逐行迭代(用於i:1:nrow(df))和字符串分割,或者使用sapply已經嘗試過,速度非常慢。因此,我希望有一個向量化的選項。優化R中的匹配
stringsasFactors = F
# example accession mapping
map <- data.frame(source = c("1", "2 4", "3", "4 6 8", "9"),
target = c("a b", "c", "d e f", "g", "h i"))
# example protein list
df <- data.frame(sourceIDs = c("1 2", "3", "4", "5", "8 9"))
# now, map df$sourceIDs to map$target
# expected output
> matches
[1] "a b c" "d e f" "g" "" "g h i"
我感謝任何幫助!
'lapply(地圖,strsplit,分裂='「)'給我一個錯誤。這對你有用嗎? – CPak
這是一個很好的解決方案。謝謝。 – user8173495
@ChiPak我從原來的例子中假設'options(stringsAsFactors = FALSE)'。如果「map」的列是因素,我的解決方案將不起作用。 –