我需要進行分析,我們需要將GBM算法應用於一系列自舉複製。另一個缺點是每個重複都需要分位標準化結果。 我試圖最終實現的是 1.從 開始主數據集2.創建一個包含200個重採樣的3維陣列 3.分位數在每個重採樣內標準化結果變量 4.全部運行GBM樣本R中的子採樣和分位數標準化
現在,我甚至無法進入重採樣步驟。
#generating some data
main<-matrix(
replicate(52,rnorm(1132)),
ncol=52,
nrow=1132,
dimnames = list(
1:1132,
1:52)
)
colnames(main)[1]<-"outcome"
#trying to create 200 resampled replicates
resampled = array (
rep(NA),
dim= c(1000, ncol(main), 200),
dimnames= list(
1:1000,
colnames(main),
1:200
)
)
for (i in 1:dim(resampled)[1]) {
for (j in 1:dim(resampled)[2]) {
for (k in 1:dim(resampled)[3]) {
resampled[i,j,k]= main[sample(nrow(main), size=1000, replace=TRUE),]
}
}}
我敢肯定這是因爲我沒有正確指定的循環,但搜索的星期後,我無法找到範例代碼,這將有助於我。
我目前得到的錯誤消息: 錯誤在重新採樣的[I,J,K] =主[樣品(nrow(主),大小= 1000,替換= TRUE),: 數項替換的是不替換長度的倍數
你可以問一個最小的可重複的問題,以小數據集和預期的結果? – shayaa
當您創建一個最小可重現的示例時,它將有助於獲得您的預期結果和您獲得的實際結果。 – pdb
我在上面。這對我來說是非常新的。將在今晚晚些時候更新,當我弄清楚如何得到一個可重複的例子。 – BobaAddict