-1
我有一個.dta格式的數據集,包含棒球運動員的身高和體重。我想計算每個體重值的平均身高。 從我所能找到的,我可以使用dplyr和「group_by」,但我的R腳本無法識別該命令,儘管已安裝並調用該程序包。個人X值的平均Y值
謝謝!
我有一個.dta格式的數據集,包含棒球運動員的身高和體重。我想計算每個體重值的平均身高。 從我所能找到的,我可以使用dplyr和「group_by」,但我的R腳本無法識別該命令,儘管已安裝並調用該程序包。個人X值的平均Y值
謝謝!
下面是一個使用從UCLA SOCR MLB HeightsWeights數據集中獲得的棒球運動員身高和體重數據在基礎R中編碼的示例。
清理完數據後(一個玩家缺少體重),我將它發佈到GitHub上,使其無需再次清理。
theCSVFile <- "https://raw.githubusercontent.com/lgreski/datasciencedepot/gh-pages/data/baseballPlayers.csv"
download.file(theCSVFile,"./data/baseballPlayers.csv",method="curl")
theData <- read.csv("./data/baseballPlayers.csv",header=TRUE,stringsAsFactors=FALSE)
aggData <- aggregate(HeightInInches ~ WeightInPounds,mean,
data=theData)
head(aggData)
...和輸出是:
> head(aggData)
WeightInPounds HeightInInches
1 150 70.75000
2 155 69.33333
3 156 75.00000
4 160 71.46667
5 163 70.00000
6 164 73.00000
>
問候,
萊恩
則u做'基地R'方法,即'aggregate'即'骨料(高度〜 (df1,tapply(height,weight,FUN = mean))' – akrun
@DespeRate - 使用'dplyr'時會收到什麼錯誤信息? –
Aggregate做到了! @akrun – DespeRate