0
我有一個包含多個類別的數據集。我想對每個類別運行線性迴歸,而不必將數據分爲每個類別的新dfs。我這樣做是這樣的:按類別運行迴歸,範圍爲平均類別的+/- 10%
category = c(rep(c("a","b","c"),100))
x = (rep(1:5,60))
y = rnorm(300)*5
df = data.frame(category,x,y)
models = dlply(df, "category", function(dflm)
lm(y ~ x, data = dflm))
lmcoefs = ldply(models, coef)
在lmcoefs,我現在有每個類別存儲係數。
但是,我只想在每個類別的平均值的+/- 50%內運行這些迴歸。因此,如果類別A的平均y值爲10,我只想運行類別A的5和15的y值之間的迴歸。與類別B和C相同。
有沒有辦法做到這一點沒有拆分數據集並運行個別迴歸?
謝謝, 唐
謝謝@ Wave!一個修正 - range.min應該是m *(1-perc),而range.max應該是m *(1 + perc) –
是的,謝謝,我沒有想到通過那部分。但現在已經修復了。 – Wave