根據多個布爾字段確定因子或創建新類別字段的最佳方法是什麼?在這個例子中,我需要計算藥物的獨特組合數量。如何計算R中布爾數據組合的數量
> MultPsychMeds
ID OLANZAPINE HALOPERIDOL QUETIAPINE RISPERIDONE
1 A 1 1 0 0
2 B 1 0 1 0
3 C 1 0 1 0
4 D 1 0 1 0
5 E 1 0 0 1
6 F 1 0 0 1
7 G 1 0 0 1
8 H 1 0 0 1
9 I 0 1 1 0
10 J 0 1 1 0
也許另一種方式來說明它是我需要樞軸或交叉列表對。最終的結果需要看是這樣的:
Combination Count
OLANZAPINE/HALOPERIDOL 1
OLANZAPINE/QUETIAPINE 3
OLANZAPINE/RISPERIDONE 4
HALOPERIDOL/QUETIAPINE 2
該數據幀在R中可以與複製:
MultPsychMeds <- structure(list(ID = structure(1:10, .Label = c("A", "B", "C",
"D", "E", "F", "G", "H", "I", "J"), class = "factor"), OLANZAPINE = c(1L,
1L, 1L, 1L, 1L, 1L, 1L, 1L, 0L, 0L), HALOPERIDOL = c(1L, 0L,
0L, 0L, 0L, 0L, 0L, 0L, 1L, 1L), QUETIAPINE = c(0L, 1L, 1L, 1L,
0L, 0L, 0L, 0L, 1L, 1L), RISPERIDONE = c(0L, 0L, 0L, 0L, 1L,
1L, 1L, 1L, 0L, 0L)), .Names = c("ID", "OLANZAPINE", "HALOPERIDOL",
"QUETIAPINE", "RISPERIDONE"), class = "data.frame", row.names = c(NA,
-10L))
1用於提供數據。不過,我相信你需要更新你的頭銜,因爲似乎沒有涉及布爾(邏輯),也沒有任何「轉換」正在進行。你可以修改它爲'計數共同事件的數量'或類似的東西嗎? –
謝謝。修改標題以匹配實際問題。關於布爾值,原始數據包括0表示FALSE和1表示TRUE,R表示從.csv文件加載時將這些變量設置爲整數。如果這些過程先轉換爲邏輯變量,這個過程會更好嗎? – Rollie
我認爲布爾的引用很好,直觀,R等於1和TRUE是一樣的,據我所知(可能有些情況下,這是不正確的)。例如,'> 1 == TRUE [1] TRUE' – Chase