在數據框中的多個列或R中的data.table中計算組索引(組標識符)的最有效方法是什麼?計算R中一個數據幀的多個列的組索引
例如,在以下的數據幀,也有和B列A的六個獨特組合
DF <- data.frame(a = rep(1:2,6), b = sort(letters[1:3]))
> DF
a b
1 1 a
2 2 b
3 1 c
4 2 a
5 1 b
6 2 c
7 1 a
8 2 b
9 1 c
10 2 a
11 1 b
12 2 c
我想添加列「索引」的一組標識符,如所產生的一個這個(大數據幀明顯低效的方法):
DF$index <- with(DF, as.numeric(factor(paste0(a, b))))
> DF
a b index
1 1 a 1
2 2 b 5
3 1 c 3
4 2 a 4
5 1 b 2
6 2 c 6
7 1 a 1
8 2 b 5
9 1 c 3
10 2 a 4
11 1 b 2
12 2 c 6
什麼是非常大的數據幀做到這一點的最快方法?
對於非常大的數據使用' data.ta ble' https://stackoverflow.com/tags/data.table/info – jogo