1
這是一個小的數據集一個簡單的任務,但我有幾百萬的觀察,所以我需要一個非常快的替代品。[R取決於對大數據的其他變量創建索引設置
我想創建索引標識對α-β的。 Alpha-beta總是成對的。用這個創建一個循環很容易,但是我發現R停止需要很長時間。任何人都知道大數據集的快速解決方案來創建下面的右列?
id var1 var2 index
A 2 alpha 1
A 3 beta 1
B 5 alpha 2
B 6 beta 2
B 4 alpha 3
B 7 beta 3
C 3 alpha 4
C 5 beta 4
D 4 alpha 5
D 8 beta 5
數據樣本:
df <- structure(list(id = structure(c(1L, 1L, 2L, 2L, 2L, 2L, 3L, 3L,
4L, 4L), .Label = c("A", "B", "C", "D"), class = "factor"), var1 = c(2L,
3L, 5L, 6L, 4L, 7L, 3L, 5L, 4L, 8L), var2 = structure(c(1L, 2L,
1L, 2L, 1L, 2L, 1L, 2L, 1L, 2L), .Label = c("alpha", "beta"), class = "factor")), .Names = c("id",
"var1", "var2"), row.names = c(NA, -10L), class = "data.frame")