我需要爲R的數據集的數據是在包含兩個矩陣一個列表的形式,並執行自舉具有以下屬性:引導中的R數據集
兩個矩陣是n由m並且只包含正整數(包括0)。
data <- list(a=matrix(,n,m), b=matrix(,n,m))
許多彈子,說10000被分配到每個矩陣,即,10000在n * m個部分被分割。換句話說,每個矩陣的所有條目的總和是固定的。
> sum(data$a) [1] 10000 > sum(data$b) [1] 10000
- 彈珠根據IJ用於彈子,即許多彈子如何結束個元素的親和力作爲基質的IJ個條目取決於與的每一個細胞相關聯的概率分佈矩陣。
- 與兩個矩陣的元素相關的概率是不同的。
我的目標是估計導致潛在可能性的參數。我的模型假設爲2n
參數,n
爲每個矩陣的行數和一組。參數以複雜的方式組合,因此兩個矩陣必須一起分析。
parameters <- data.frame(a=numeric(n), b=numeric(n))
現在,這是我使用的方法:
我定義一個函數
SGen
這需要輸入包含所有網站相關聯的概率矩陣,利用這些概率生成的數據集和返回它。SGen <- function(freq) { #generate sample ... }
對於非參數引導(這是我想要實現對現在是什麼),I進行實驗,並通過將所觀察到的矩陣與10000計算與每個IJ元件相關聯的觀測概率。現在讓我們稱它爲
freq
。所以,freq
是一個包含兩個矩陣的列表。freq <- list(a=data$a/10000, b=data$b/10000)
- 接下來,我通過傳遞
freq
SGen
到複製100個樣本數據。 - 我將所有重複項傳遞給另一個預定義的函數
analyze
,它給出了100 n乘以2個包含參數的矩陣。 - 接下來,我計算所有矩陣之間的條目的平均值和sd,以得到一個n乘2的矩陣包含平均值,而另一個包含sd。因此,平均矩陣的第(1,5)個元素的期望值是所有100個重複中第(1,5)個元素的平均值。
雖然這種方法的工作原理,我想在R中使用啓動包作爲工作。我想這樣做,因爲那樣我就可以在啓動包中使用所有的功能,以便以後進行分析,並且我還喜歡重要信息以boot類格式存儲的方式。我想使用引導軟件包的另一個重要原因是它提供了一種使用我的計算機的多核功能的簡單方法。那麼,請你指導我如何使用boot
達到我的目的?
'bootstrap'函數是爲特定項目開發的。 'bootstrap'的作者推薦的boot包是我正在嘗試使用的。 'bootstrap'沒有並行處理功能。 [鏈接] https://cran.r-project.org/web/packages/bootstrap/bootstrap.pdf –
感謝您的答案。我試圖做的主要問題是控制'boot'函數生成新樣本的方式。從我的閱讀中,我認爲控制新樣本繪製方式的唯一方法是將其作爲參數引導。但是我的數據集變得越來越複雜,我正在研究'foreach'包,以便更直接地實現我想要做的事情。 –