我有一個結構化的純種名的數據庫,如下所示:如何使用鏈式ifelse和grepl?
HorseName <- c("Grey emperor", "Smokey grey", "Gaining greys", "chestnut", "Glowing Chestnuts", "Ruby red", "My fair lady", "Man of war")
Number <- seq(1:8)
df <- data.frame(HorseName, Number)
我現在想搜索的每匹馬的名字中的顏色出現次數。具體而言,我希望選擇「灰色」和「栗色」的所有實例,創建一個標識這些顏色的新列。任何其他名稱都可以簡單地稱爲「其他」。不幸的是,名稱不一致,包含複數形式和不同的格式。我會如何去做R?
我的預期產出將是:
df$Type <- c("Grey", "Grey", "Grey", "Chestnut", "Chestnut", "Other", "Other", "Other")
我熟悉鏈ifelse聲明,但不知道該如何處理多OCCURENCES和敏感的情況下!
簡單,將您輸入的所有文本小寫和你的模式爲grepl應該是下殼的。 – amrrs