2017-07-31 74 views
-5

我想將不同的data.tables與藝術家數據合併。但是,藝術家的名字在我的一些數據集中以不同的方式拼寫。我正在尋找一種簡單方便的方式來匹配這些藝術家的名字,這樣我就可以給每位藝術家一個ID,這樣可以更容易地合併我的數據集。我對R還是比較新的,我想知道你能不能給我一些關於這個話題的指導。藝術家名字基本上是不同data.tables中的字符串。在R data.table中匹配文本名稱

+1

重複的例子? – lmo

回答

0

您可以依次使用?revaluelibrary(plyr)糾正名稱,然後將它們合併

dt_age <- data.table(artist=c("Dali","Van Gogh"), 
       age=c(85,37)) 
dt_paintings <- data.table(artist=c("dali","van gogh"), 
        paintings=c("The peristence of Memory","The Starry Night")) 

merge(dt_age,dt_paintings,by="artist") # this is empty 

artist_correct <- c("dali"="Dali", 
         "van gogh"="Van Gogh" 
        ) 
dt_paintings$artist <- revalue(dt_paintings$artist,artist_correct) 

merge(dt_age,dt_paintings,by="artist") # this is correct after we correct the names