0
我正在使用R中的寶寶姓名數據進行練習。max([column])其中名稱=(每個姓名在名稱列中)每年在R
total_n <-babynames %>%
mutate(name_gender = paste(name,sex))%>%
group_by(year) %>%
summarise(total_n = sum(n, na.rm=TRUE)) %>%
arrange(total_n)
bn <- inner_join(babynames,total_n,by = "year")
df <- bn%>%
mutate(pct_of_names = n/total_n)%>%
group_by(name, year)%>%
summarise(pct =sum(pct_of_names))
數據幀輸出是這樣的:
對於每一個名字,還有這些年來,和當年相關的PCT。我堅持要爲每個名稱獲得最高的年份。我該怎麼做呢?
omg,不敢相信就這麼簡單,我正在考慮循環。謝謝! –
也隨時接受答案! – Steven