我想知道是否有人在這裏能幫助我。我有兩個數據幀包含3列:names
,gender
amount
,兩年不同。我希望能夠比較每個數據框中名稱的起起落落。比較R中兩個數據幀的值
預先感謝您!
編輯 -
d=read.table("names2000.txt",header=FALSE,sep=",")
colnames(d)=c('name','gender','amount')
這爲今年2000
提供數據。然後我用do.call(rbind, by(d, list(d$gender), FUN=head,5))
找到前5名男性和女性的名字,其返回
name gender amount
F.1 Linda F 80412
F.2 Mary F 65443
F.3 Patricia F 47920
F.4 Barbara F 41560
F.5 Susan F 38019
M.6107 James M 86139
M.6108 Robert M 83534
M.6109 John M 79396
M.6110 Michael M 65141
M.6111 David M 60704
爲我所用
j=read.table("names2010.txt",header=FALSE,sep=",")
colnames(j)=c('name','gender','amount')
這爲今年「2010」的返回數據的第二數據幀我試圖再次使用do.call(rbind, by(d, list(d$gender), FUN=head,5))
發現男性和女性在今年的前5名,但我得到的錯誤信息
> "Error in tapply(seq_len(33983L), list(c(1L, 1L, 1L, 1L, 1L, 1L, 1L,
> 1L, : arguments must have same length"
我想例如是否比較前10名VALU與2010年數據集相比,2000年數據框的數據增長或下降。有沒有一種方法可以計算出兩年內名稱增加最多的金額?
請發佈一些您的數據樣本,以及您迄今爲止所做的任何嘗試。 [請閱讀這篇文章](http://whathaveyoutried.com) – Barranka 2014-10-07 19:58:55
我已經編輯了上述內容,以包含我的數據的一個小樣本。它返回兩個數據框的表格,每個表格列出了當年出生的嬰兒的名字,按女性的數量從大到小的順序排列,然後是男性。對不起,我沒有其他的東西了。我真的不知道該從哪裏開始:( – Frankj77 2014-10-07 20:27:47
)你的問題現在處於暫停狀態,所以它不能得到任何答案。你認爲你是別人並問自己:「我能幫助這個人嗎?有足夠的信息嗎?「請閱讀:[幫助中心:如何問一個好問題](http://stackoverflow.com/help/How-to-ask)。編輯你的問題並添加一個數據樣本(它不我們很樂意提供幫助,但我們需要很好的信息才能開始 – Barranka 2014-10-07 20:46:49