2017-11-25 98 views
-1

我有一個.dta格式的數據集,包含棒球運動員的身高和體重。我想計算每個體重值的平均身高。 從我所能找到的,我可以使用dplyr和「group_by」,但我的R腳本無法識別該命令,儘管已安裝並調用該程序包。個人X值的平均Y值

謝謝!

+1

則u做'基地R'方法,即'aggregate'即'骨料(高度〜 (df1,tapply(height,weight,FUN = mean))' – akrun

+0

@DespeRate - 使用'dplyr'時會收到什麼錯誤信息? –

+1

Aggregate做到了! @akrun – DespeRate

回答

1

下面是一個使用從UCLA SOCR MLB HeightsWeights數據集中獲得的棒球運動員身高和體重數據在基礎R中編碼的示例。

清理完數據後(一個玩家缺少體重),我將它發佈到GitHub上,使其無需再次清理。

theCSVFile <- "https://raw.githubusercontent.com/lgreski/datasciencedepot/gh-pages/data/baseballPlayers.csv" 
download.file(theCSVFile,"./data/baseballPlayers.csv",method="curl") 
theData <- read.csv("./data/baseballPlayers.csv",header=TRUE,stringsAsFactors=FALSE) 
aggData <- aggregate(HeightInInches ~ WeightInPounds,mean, 
       data=theData) 
head(aggData) 

...和輸出是:

> head(aggData) 
    WeightInPounds HeightInInches 
1   150  70.75000 
2   155  69.33333 
3   156  75.00000 
4   160  71.46667 
5   163  70.00000 
6   164  73.00000 
> 

問候,

萊恩