我有一個從.csv讀取的調查數據的大數據框,看起來像這樣簡化後。r函數不會識別字符串中的撇號
x <- data.frame("q1" = c("yes","no","don’t_know"),
"q2" = c("no","no","don’t_know"),
"q3" = c("yes","don’t_know","don’t_know"))
我想創建使用rowSums列如下
x$dntknw<-rowSums(x=="don’t_know")
我能做到這一點對所有的yes
和no
答案很容易,但在我的數據框只是生成用於don’t_know
的零。 我以前有一個撇號看起來像這樣的問題don’t_know
。我向read.table
添加了encoding = "UTF-8"
來解決這個問題。但是現在我似乎無法獲得任何R函數來識別它,我嘗試了gsub("’","",df)
,但是這並不像rowSums
那樣工作。 這是編碼問題嗎?有沒有正則表達式的解決方案來消除它們?有什麼解決辦法來解決這個問題?
它適用於我(使用德語區域設置) –