2012-09-27 23 views
2

我剛開始瞭解PCA,我希望將它用於超過4,00,000行的巨大微陣列數據集。我有我的樣品列和基因/基因座形式的列。我在使用PCA時遇到了一些教程,並遇到了princomp()和prcomp()以及其他一些教程。如何在大數據集中使用R中的princomp()或prcomp()函數,而不會傳輸數據?

現在,正如我在這裏所瞭解的那樣,爲了在雙標圖中繪製樣本,我需要將它們放在行中,並將基因/位點放在列中,因此我將不得不轉換我的數據在用於PCA之前。

但是,由於行數超過4,00,000,我不能將它們轉換爲列,因爲列是有限的。所以我的問題是,是否有任何方法可以對我的數據執行PCA,而無需轉換它,使用這些R函數?如果不是的話,你們中的任何人都可以建議我採取其他方式或方法嗎?

回答

5

你爲什麼討厭轉置你的數據?這很容易!

如果你讀了您的數據轉換成R(例如,作爲基體microarray.data),你可以只用一個命令轉他們:

transposed.microarray.data<-t(microarray.data) 
+0

噢,是的..這工作.. :)它不是我恨換位..我試圖在Excel文件,這沒有工作。我沒有意識到可以這樣做..非常感謝你:) – Letin

相關問題