-5
我想將不同的data.tables與藝術家數據合併。但是,藝術家的名字在我的一些數據集中以不同的方式拼寫。我正在尋找一種簡單方便的方式來匹配這些藝術家的名字,這樣我就可以給每位藝術家一個ID,這樣可以更容易地合併我的數據集。我對R還是比較新的,我想知道你能不能給我一些關於這個話題的指導。藝術家名字基本上是不同data.tables中的字符串。在R data.table中匹配文本名稱
我想將不同的data.tables與藝術家數據合併。但是,藝術家的名字在我的一些數據集中以不同的方式拼寫。我正在尋找一種簡單方便的方式來匹配這些藝術家的名字,這樣我就可以給每位藝術家一個ID,這樣可以更容易地合併我的數據集。我對R還是比較新的,我想知道你能不能給我一些關於這個話題的指導。藝術家名字基本上是不同data.tables中的字符串。在R data.table中匹配文本名稱
您可以依次使用?revalue
從library(plyr)
糾正名稱,然後將它們合併
dt_age <- data.table(artist=c("Dali","Van Gogh"),
age=c(85,37))
dt_paintings <- data.table(artist=c("dali","van gogh"),
paintings=c("The peristence of Memory","The Starry Night"))
merge(dt_age,dt_paintings,by="artist") # this is empty
artist_correct <- c("dali"="Dali",
"van gogh"="Van Gogh"
)
dt_paintings$artist <- revalue(dt_paintings$artist,artist_correct)
merge(dt_age,dt_paintings,by="artist") # this is correct after we correct the names
重複的例子? – lmo