2017-05-09 118 views
1

我有一個西里爾文寫的名字和姓氏列表。字母轉換 - 西里爾文到拉丁文

head(text, n = 20) 
    unique(clients$RODITEL) 
1      <NA> 
2     ЃОРЃИ 
3    ALEKSANDAR 
4    000000000000 
5     ТР4АЈЧЕ 
6      0 
7     HHHHHHH 
8     0000000 
9     TASKO 
10 -------------------- 
11     ДРАГИ 
12     СЛАВЧО 
13      ACO 
14     НИКОЛА 
15     САШО 
16     НАУМЧЕ 
17     ОРЦЕ 
18     САНДРА 
19     МИРСАД 
20     ОКТАЈ 

我需要做的是將寫在Cyrlic上的名字(如最後10行)轉換爲拉丁語。

所以輸出將是:

1      <NA> 
2     GJORGJI 
3    ALEKSANDAR 
4    000000000000 
5     TRAJCHE 
6      0 
7     HHHHHHH 
8     0000000 
9     TASKO 
10 -------------------- 
11     DRAGI 
12     SLAVCHO 
13      ACO 
14     NIKOLA 
15     SASHO 
16     NAUMCHE 
17     ORCE 
18     SANDRA 
19     MIRSAD 
20     OKTAJ 

具體,Cyrlic字母是馬其頓。

我不確定是否有任何R包處理這種轉換?

回答

2

您可以使用函數從包裝stringi,例如:

> stri_trans_general('ДРАГИ', 'latin') 
[1] "DRAGI" 
+0

我不知道這個包的。謝謝。 – Prometheus