2012-09-21 57 views
-2

1:我想要創建14.000個基因(行)和250個樣本(矩陣的列)的合成數據集。 這可以怎麼做?
2:在此之後,我想推斷使用互信息算法的基因調控。我知道如何和事實上我有一個網絡。
3:我想知道我所擁有的網絡是否偶然到期。爲此,一種常見的方法是對樣本或基因進行1000次篩選,以創建1000個網絡並繪製空分佈以驗證之前(第2點)獲得的網絡。這被稱爲引導程序。 還有其他方法嗎?如何構建空分佈

最佳,

E.

+0

此問題更適合[CrossValidated](http://stats.stackexchange.com/),因爲它是純粹的統計問題。儘管你或我沒有足夠的聲望來遷移它。 – Backlin

+0

非常感謝!這是一個很好的建議! – Elb

回答

1

在R中sample功能是構建現有數據的隨機置換的基本方法。目前還不清楚你想要什麼,還有一個想法是你可能只需要指出runif函數來生成隨機均勻序列。如果你有1000個對象中的對象矢量特定排序,OBJ:

sample(obj) # returns a permuted sequence 
# Same as ... 
obj[ sample(length(obj)) ] 

無論是「零分配」是由你來決定。 (並且要求所有在R中執行任何特定任務的方法都被視爲過分苛刻,通常有大量的方法,甚至要求「最好」會增加你獲得你的機會問題已關閉。)

+0

嗨迪文,謝謝!問題在於,我認爲交叉驗證的方法只是一個混淆。例如。有bootstrap,leave-one-out ecc。 ECC。我需要一個簡短描述的「列表」,以更好地瞭解根據我的情況使用哪種方法。無論如何謝謝你建議我的「樣本」功能。 – Elb

+0

不幸的是,有關於這個主題的書籍,你提供寶貴的小指導討論。 –

+0

我完全同意你的看法。這對我來說是一個新領域,我只需要在這裏看到! – Elb