0
我有一些損壞的字符的文件,我想清理,只保留字母和數字。數據是這樣的:只保留字母和數字,如果文本已損壞的字符?
data <- c("120 RED[¹", "121 ªÚêÝk College", "[²¯x¬ Street", "Sky ªÚêÝk")
所需的輸出是:
clean_data <- c("120 RED","121 College", "Street","Sky")
我有一些損壞的字符的文件,我想清理,只保留字母和數字。數據是這樣的:只保留字母和數字,如果文本已損壞的字符?
data <- c("120 RED[¹", "121 ªÚêÝk College", "[²¯x¬ Street", "Sky ªÚêÝk")
所需的輸出是:
clean_data <- c("120 RED","121 College", "Street","Sky")
這與 「」 全部替換,除了字母,數字,&空格:
gsub("([^A-Za-z0-9 ])+", "", x = data)
[1] "120 RED" "121 k College" "x Street" "Sky k"
我恐怕它仍然保留隨機K,X,和K在那裏,那些是正常的信件被破壞的人所包圍。
有不想要的字符雖然 – Sotos
@ Z.Lin謝謝正是我想要的。 – Curious