跟進一個分析,我got a lot of help on previously,我試着今天重新運行一個腳本,並得到路障。不知道是否有更新的東西爆炸或什麼。我試圖根據分層結構中的數據點獲得斜率。最終的結果是一樣的東西:lml,dplyr和摘要 - 我有什麼東西嗎?
Var1 Var2 Var3 Max Min Var Avg_Temp Count Pearson Slope
X2 X2 X6 156 7 149 28 51 -0.049 -0.111
X1 X2 X6 84 1 83 24 51 -0.345 -0.532
X1 X2 X7 184 8 176 33 45 -0.236 -0.825
X1 X4 X7 193 10 183 32 44 -0.131 -0.487
X1 X2 X5 33 4 29 21 34 -0.343 -0.251
X1 X1 X5 51 10 41 23 21 -0.088 -0.091
X1 X4 X6 62 7 54 23 20 0.045 0.070
X3 X2 X6 61 18 43 31 18 -0.345 -0.491
的原始數據我用緊縮這是在這裏:http://pastebin.com/pGyeCFpH
我從上線那裏得到的反饋是教育的工作,但我覺得我的例子所做的多問複雜。在任何情況下,我開始工作的腳本是:
library(dplyr)
data <- read.table("clipboard",sep="\t",quote="",header=T)
newdata = summarise(group_by(data
,Var1
,Var2
,Var3
)
,Max = max(Temp)
,Min = min(Temp)
,Var = max(Temp) - min(Temp)
,Avg_Temp = mean(Temp)
,Count = length(Temp)
,Slope = summary(lm(Temp ~ Time))$coeff[2]
,Pearson = cor(Time, Temp, method="pearson")
)
sortNewdata <- newdata3[order(-newdata3$Count),]
row.names(sortNewdata)<-NULL
所有作品除上述斜率功能。在腳本工作之前,我只是嘗試了一個簡單的Slope = lm()
,但似乎R無法解析我的數據變量中的列名。所以我把summary(lm())
,這給了我正在尋找的斜坡。我想更新R(我還沒有重新在一段時間這個腳本)後,打破了東西的地方它返回了不同的錯誤比以前:
Error in terms.formula(formula, data = data) : invalid term in model formula
是否有一個快速修復這個?我覺得我錯過了一些非常簡單的事情,考慮到經典案例「以前工作得很好,但現在它不會」-itis。