2016-10-14 41 views
-1

我有一個數據框,其中包含兩個類型cols - 數字和因子。 如何在新列中將每個元素與組平均值進行區分。 我可以找到'集合'的組平均值,但我不能提取每個元素之間的差異,它是組平均值(不同長度)。r每個元素與組意味着差異

+0

當要求編程幫助時,預計您會在樣本中包含[可重現的示例](http://stackoverflow.com/questions/5963269/how-to-make-a-great-r-reproducible-example)輸入數據和期望的輸出。 – MrFlick

回答

2

你可以用一個基本的線性模型很容易地做到這一點(我刪除了截距,以便每個效果的值是模型概要中的組平均值)。讓我們的data(mtcars)的例子中,變量am是您的分組因子和mpg您的數值變量:

mtcars$am <- factor(mtcars$am) 
lm(mpg~am-1, mtcars)$resid 

這個模型的殘差定義元素和它的組之間的差異的意思。