0
我有一個數據幀的工作在另一個data.frame創建一個列的100個隨機抽樣data.frame
df <- data.frame(a = c("gene1", "gene2", "gene3", ...),
b = c(10, 20, 30, ...))
我想創建一個由每100列的新數據幀其中包含來自原始數據幀的列a
的250個基因的不同隨機選擇。這是我迄今爲止嘗試:
data.frame(matrix(data = df[sample(nrow(df), 250), 1],
ncol = 100, nrow = 250))
然而,這種填充用相同的隨機抽樣,而不是唯一的一個每一列。
使用'重複(100,樣本...)'。你的'樣本'表達很好。你可以用'data.frame'包裝整個東西。 –
謝謝,那很好用! –
您提供給'matrix'的'data'的元素數量比創建的維度要少,因此它會被回收。根據您希望替換的方式,您可以增加樣本大小以匹配,例如'sample(nrow(df),100 * 250)' – alistaire