0
我已經找遍了這個,但沒有找到答案。我有一個數據框,其中包含沿着「未知」「無響應」或「拒絕回答」之類的多個級別的列。所有這些對我來說都是無用的分析,所以我想用NA來代替它們。替換R中的特定數據幀列中的多個字符串
請注意,我不想在整個數據框中只替換它們,只有特定的列!還有其他一些列包含的值與我實際有用的名稱相同,我想讓它們保持獨立。
我已經成功使用,以取代他們一次一個:
data$col1 <- factor(gsub("Unknown", "NA", data$col1))
但每次只適用於一個字符串。如果我嘗試添加多個字符串,R會引發錯誤。有沒有更有效的方法來做到這一點?
我是比較新的編碼,請溫柔!
在read.csv中使用'na.strings',即在讀取數據集時,可以指定哪些值可以更改爲NA,'dat < - read.csv (「yourfile.csv」,na.strings = c(「Unknown」,「No response」,「拒絕回答」))' – akrun
嘗試'data $ col1 < - factor(gsub(「Unknown | No response | Refused to答案「,」不適用「,數據$ col1))'。 –