我的輸入如下所示。我想創建2個新列 - 一列將是基因名稱的重複數目,另一列將是值的總和。誰能幫忙?計算列中的重複ID並將awk中的值相加或R
輸入:
gene1 5
gene1 4
gene2 7
gene3 6
gene3 2
gene3 3
預期輸出:
gene1 2 9
gene2 1 7
gene3 3 11
數據:
dd <- read.table(header = FALSE, stringsAsFactors = FALSE, text="gene1 5
gene1 4
gene2 7
gene3 6
gene3 2
gene3 3")
請用簡單的重現方式輸入輸入,例如,使用'dput'in R.另外,您嘗試過什麼? – iled
'aggregate(dd,by = dd ['V1'],function(x)if(is.numeric(x))sum(x)else length(x))' – rawr