0
我有一個數據集,主要包含分類變量(因子),我試圖格式化。 數據集當前格式是這樣的:爲相同級別的不同因素創建虛擬變量
Obs X1 X2 X3 X4 ... X50
1 A B C D
2 B A D E
3 B C D A
然而,一種用於X1和X2應該是指相同的,即,X1和X2可以被認爲是什麼因素首次發現的。我的想法是使用假人來制定數據集;
Obs A B C D ...
1 1 1 1 1 ...
2 1 1 0 1 ...
3 1 1 1 1 ...
我一個解決方案,嘗試過:我已經分居了所有的分類變量進入data.frame DF,然後嘗試爲所有的因素,每個級別創建虛擬變量。
for (i in 1:ncol(df)){
for(level in df[,i]){
df2[paste("", level, sep="")] = ifelse(i == level, 1, 0)
}
}
然而,當我嘗試運行此編碼R似乎停止了 - 是有爲什麼這不應該工作的任何原因? 有沒有人有任何建議,以更有效的方式來處理這個問題?
感謝您的任何建議