我有俄語的字符矢量。請參閱下面的樣本載體 -在R中找到字母數字
x = "nНозологические единицы \r\n В20 Болезнь, вызванная вирусом иммунодефицита человека [ВИЧ], проявляющаяся в виде \r\nинфекционных и паразитарных болезней \r\n В21 Болезнь, вызванная вирусом иммунодефицита человека [ВИЧ], проявляющаяся в виде \r\nзлокачественных новообразований \r\n В22 Болезнь, вызванная вирусом иммунодефицита человека [ВИЧ], проявляющаяся в виде \r\nдругих уточненных болезней \r\n В78.1 Болезнь, вызванная вирусом иммунодефицита человека [ВИЧ], проявляющаяся в виде \r\nдругих состояний \r\n В24 Болезнь, вызванная вирусом иммунодефицита человека [ВИЧ], неуточненная \r\n Z21 Бессимптомный инфекционный статус, вызванный вирусом иммунодефицита человека"
我想提取這些值 - B20,B21,B22,B78.1,B24,Z21。我正在使用下面的代碼 -
gsub("[^0-9A-Za-z///' ]", "", x)
但它返回了錯誤的結果。
[1] "n 20 21 22 781 24 Z21 "
你想要所有的ASCII字符串格式的子字符串嗎? –
是的,我希望所有的子字符串格式爲ASCII字母數字 – john