我試圖評估不使用整個測試集的迴歸模型,但只有X%的排名最靠前的預測,這是迴歸的目標。 在R中有沒有包允許做到這一點?Spearman相關性排名前X%%
所以,舉例來說,如果我有以下
x<-c(1,2,3,4,5,8,7,9,12,11,14,15,16,17,20,25,40)
y<-c(0,1,2,4,5,6,8,7,10,12,15,14,13,10,18,22,30)
df<-cbind(x,y)
model<-lm(y~x)
summary(model)
多個R平方:0.9432,調整R平方:0.9395
plot(y~x,df)
abline(model)
我想有一個參數「X 「(30%),它不是使用斯皮爾曼的秩序相關指數來計算全部數據集,而是隻計算30%的數據。 在這種情況下,它應該只計算x=c(15,16,17,20,25,40)
。 這個「部分」相關指數可能有助於對可能具有較差R平方的模型進行進一步表徵,但在該領域的精確區域(例如X的頂部X%)中執行得更好。 感謝任何指針。
不完全清楚你想要什麼:'lm(y〜x,data = df,subset = x> quantile(x,0.7))''? –
@Ben。謝謝。我不想用較少的數據改變模型,只是在選擇的子集上「測量」模型。 –