我正在用R分析一些基因表達數據。我想用limma的eBayes(limme是BioConductor的一部分)做差異基因表達分析,但要做到這一點,我需要將我的表達數據作爲eset對象。事情是,我只有預處理的數據,沒有CEL文件,我可以直接轉換成eset對象。我試圖從互聯網上搜索,但找不到解決方案。我發現的唯一的事情是它是可能的。從預處理的表達矩陣創建eset對象?
爲什麼eBayes: 它應該有,即使只有兩三中的一些羣體的樣本穩定的結果,我確實確實有3組是2〜3個樣品的尺寸。
詳細我有什麼想要做的: 我有表達數據,已經作爲對數,標準化的intesity值。數據在表達式矩陣中。大約有20 000行,每行是一個基因,rownames是官方的基因名稱。有22列,每列對應一個癌症樣本。我在那裏有不同種類的癌症亞型,並想比較例如亞型1樣本的基因表達與第2組的樣本的基因表達。下面是我的矩陣看起來像兩行,5列的例子。
示例矩陣:
SAMP1 SAMP2 SAMP3 SAMP4 SAMP5
GENE1 123.764 122.476 23.4764 2.24343 123.3124
GENE2 224.233 455.111 124.122 112.155 800.4516
問題: 評價與eBayes基因差異表達,我需要的ESET對象進行這種表達數據的,我必須誠實地不知道如何去關於那一步。 :(
我對信息的每一位,可以幫助我出去!如果有人可以建議小樣本比較的另一個可靠的方法,有可能解決我的問題也很感激。
謝謝!
這個小插曲應該幫助你 - http://bioconductor.org/packages/release/bio c/vignettes/Biobase/inst/doc/ExpressionSetIntroduction.R – jalapic 2014-08-30 12:43:17
ExpressionSet()似乎工作!謝謝!我之前嘗試過,但沒有足夠的例子來弄清爲什麼它不喜歡我的數據。事實證明,它被存儲爲數據幀... – scinaya 2014-08-30 12:51:51
分析通常以'lmFit'開始,而不是'eBayes',並且'lmFit'採用矩陣; from'?lmFit':「object:類'numeric','matrix','MAList','EList'的對象, 'marrayNorm','ExpressionSet'或'PLMset'包含 的對數比或對數值表達一系列 微陣列「。此外,有關Bioconductor問題的問題在Bioconductor [郵件列表]上更好地提出( http://bioconductor.org/help/mailing-list/) – 2014-08-30 13:23:19