看這段代碼:PROC glmselect訓練和測試
ods graphics on;
proc glmselect data=analysisData testdata=testData
seed=1 plots(stepAxis=number)=(criterionPanel ASEPlot);
partition fraction(validate=0.5);
class c1 c2 c3(order=data);
model y = c1|c2|c3|x1|x2|x3|x4|x5|x5|x6|x7|x8|x9|x10
|x11|x12|x13|x14|x15|x16|x17|x18|x19|x20 @2
/selection=stepwise(choose = validate
select = sl)
hierarchy=single stb;
run;
從here服用。我明白你明確地定義了訓練(analysisData)和測試數據集(testData)。我不完全理解的是PARTITION語句。這是否意味着分析數據被分割爲使用一半的分析數據用於訓練,另一半用於「測試」又名驗證,以確定例如候選模型的選定自變量如何執行?換句話說,testData從不用於訓練,正如我所期望的那樣。
PS:
順便說一句,我怎麼可以從80/20%分割一個originalDataset創建analysisData和TESTDATA?