我必須創建獨特的組合,同時允許一些不匹配。下面是一個例子:缺失或錯配的組合
set.seed (1234)
dataf <- data.frame (var1 = sample(c("A", "B", "-"),20, replace = T),
var2 = sample(c("A"),20, replace = T),
var3 = sample(c("B", "B", "B", "-"),20, replace = T),
var4 = sample(c("A","A", "A", "-"),20, replace = T),
var5 = sample(c("A", "B", "A", "A", "-"),20, replace = T)
)
dataf
規則:
(1)生成唯一的組合:
A B A B B - combination 1
A A A B B - combination 2
B B B A A - combination 3
so on ...
(2)允許一個(可以是n)不匹配以創建一個類別。例如:
A B A B B
A A A B B
B A A B B
B A B B B
B A A B A
與在不同變量下存在單個失配相同。
(3)「 - 」表示缺失值,可以類似方式在匹配整數意味着允許一個錯配處理。
A B A B B
A - A B B
A B A - B
但是,如果有兩個缺失值然後組合被聲明未知( - )
A B A B B
A - A - B
A B A - -
以下是上述數據的鍛鍊。
var1 var2 var3 var4 var5 comb
1 A A B - - -
2 B A B A A 1
3 B A B A A 1
4 B A B A A 1
5 - A B A A 1
6 B A B A - 1
7 A A B A B 2
8 A A B A B 2
9 B A B A A 1
10 B A - A - -
11 - A B A A 1
12 B A B - - -
13 A A B A A 2
14 - A B - A -
15 A A B A A 2
16 - A B A A 2
17 A A B A B 2
18 A A - A A 3
19 A A B A B 2
20 A A - A A 3
任何想法?
只是一個小想法,你可以合併到VAR1 VAR5創造新的因素 - 例如(AABAA等),那麼你可以在這個變量工作...我不知道我們如何能夠在單一的不匹配工作 – jon