第1部分我有以下數據表。我想創建一個新的列,其中包含每個id
出現的數字,其中有任何樣式值,但NA
除外。主要問題是我不知道如何處理NA
。目前,當NA
存在我得到的1將一列中的NAs作爲零頻率的兩列頻率
id style
1 A
1 A
2 A
2 B
3 NA
4 A
4 C
5 NA
我使用下面的嘗試頻率,但它仍然被NA
值
dt[, allele_count := .N, by = list(pat_id, style)]
所需的數據表將如下所示:
id style count
1 A 2
1 A 2
2 A 2
2 B 2
3 NA 0
4 A 4
4 B 4
4 B 4
4 C 4
5 NA 0
第2部分我還希望能夠添加另一列,其數目爲每個id
具有一定的樣式值。
id style count2
1 A 2
1 A 2
2 A 1
2 B 1
3 NA 0
4 A 1
4 B 2
4 B 2
4 C 1
5 NA 0
獎金問題:而不是看多少次id
發生與給定style
值作爲第2部分,你怎麼能計算不同style
值數爲每個id
,如如下。
id style count3
1 A 1
1 A 1
2 A 2
2 B 2
3 NA 0
4 A 3
4 B 3
4 B 3
4 C 3
5 NA 0
不確定第一個計數...例如,如果另一個id = 3的樣式爲B,您可以在此示例中添加預期結果嗎? (也檢查你的初始data.table,因爲它沒有四個id = 4 ...) – digEmAll
期望的輸出與給定的輸入不匹配。 –