2012-10-16 70 views
1
I have the matrix in the following format : 


ID_REF  GSM362180 GSM362181 GSM362188 GSM362189 GSM362192 
244901_at 5.094871713 4.626623079 4.554272515 4.748604391 4.759221647 
244902_at 5.194528083 4.985930299 4.817426064 5.151654407 4.838741605 
244903_at 5.412329253 5.352970877 5.06250609 5.305709079 8.365082403 
244904_at 5.529220594 5.28134657 5.467445095 5.62968933 5.458388909 
244905_at 5.024052699 4.714631878 4.792865831 4.843975286 4.657188246 
244906_at 5.786557533 5.242403911 5.060605782 5.458148567 5.890061836 

在上面的矩陣中,第一列是基因列表(22810),相應的列對應於不同的啓動子(總共4種不同的類型)。在這種情況下如何找到差異表達的基因?R中差異表達的基因

我想用t檢驗來確定DEG's。在兩種情況下(如控制和處理),我知道要在R中使用多測試包找到DEG。但不知道如何處理四種不同類型的啓動子並確定DEG。

+0

我看到五列,但只提到四個發起人,有多少樣本(或每個啓動子的樣本)嗎?另外,您有什麼問題:您是否在尋找啓動子的一般效應(無論哪個!)或者您想創建四個基因列表 - 每個啓動子一個? – January

+0

@ January:實際上總共有8列是每個啓動子的複製品,總共有4個啓動子(有兩個複製品使它成爲8列)我想創建一個差異表達的啓動子列表,以及另一個列表每個prom的基因列表oter。所以我會要求兩種可能性。 –

+0

我可以使用limma軟件包,但不知道如何去做,否則我應該使用方差分析? –

回答

2

使用limma包可用於各種微陣列差異表達。它有一個很好的小插圖,可用(連同安裝說明)在其Bioconductorlanding page。如果使用limma,跟進Bioconductor的問題mailing list(但請閱讀小插曲,並有人用一些統計知識第一,如果有必要諮詢。