,我不知道我是否應該列入各級當我創建從一個列表中的因素:因子水平假人變量R
random_merge_patients$MedCond <-factor(sort(random_merge_patients[[35]]))
因子的例子看起來是這樣的:
[6589] "wt loss ftt arthritis anemia of chronic disease mild cognitive impairment hx gout dehydration prednisone therapy long term med use"
如果水平應該被選中,我會選擇什麼?任何人都可以澄清,因爲這是令我困惑的。
我要使用這個變量來創建一個虛擬變量,但即使我在$Dementia
沒有錯誤消息,所有的值都爲0,但有些應該是1秒:
random_merge_patients$'MedCond_Dementia'<-ifelse(random_merge_patients$'MedCond' == "dementia",1,0)
你的例子對於真正的幫助有點稀疏,但是我建議,以你的例子'MedCond'爲例,因素實際上並不合適。我建議把它們保留爲'character',並使用'c $ MedCond_Dementia < - grepl(「\\ bdementia \\ b」,x $ MedCond,ignore.case = TRUE)'',因爲'... ==「由於「字符串包含...」,癡呆症「不起作用」。 – r2evans