基因集富集分析

我已經使用cummeRbund功能findSimilar（）來找到與使用Cuffdiff鑑定的差異表達基因I最相似的10個基因。這使用了Jensen-Shannon距離，並生成了一個排序的有序基因列表，我現在要測試GO富集。該文件是這樣的：基因集富集分析

"XLOC_007917" 0 
"XLOC_008881" 0.00417099861122699 
"XLOC_017692" 0.0178758082512721 
"XLOC_008901" 0.0180682577435933 
"XLOC_014267" 0.0333227735282459 
"XLOC_013408" 0.0400392521794019 
"XLOC_013497" 0.0412541820119971 
"XLOC_010554" 0.0453928603025379 
"XLOC_000570" 0.0461264880687295 
"XLOC_010786" 0.0469577467848723

我先手動搜索GO術語每個最相似的基因，但我想做一個更強大的分析。我試圖運行Broad Institute的Java應用程序GSEA。

我做了我的排名列表文件格式（* .rnk），現在我必須選擇一個基因集數據庫。

我正在研究海綿物種，所以我不能使用已經提供的數據庫。

如何創建我自己的基因集數據庫？它應該是什麼樣子？

來源

2013-07-11 user1819854

輔助組裝後我的策略不同。我使用Cufflinks提取新發現的基因序列，找到CDS，進行BLAST並獲取GO術語。另一種選擇是使用已知ID的基因並使用gProfiler進行富集分析。例如，您可以免費試用Blast2go來進行分析。您可以在本地安裝數據庫，Blast會更快。您可以使用Blast2go進行濃縮分析。你也可以使用安裝Galaxy的一個實例，並從他們的工具倉庫獲取Blast2go。

來源

2015-06-17 22:13:51 degopwn

爲了使它與GSEA一起工作，您需要在文件的第一列中有官方人類基因符號作爲基因標識符。確保每個基因在您的排名列表中只出現一次也是一個好主意。另外請注意，在預先排序的模式下，GSEA總是按降序對輸入進行排序。

來源

2017-12-02 05:53:47

基因集富集分析

回答

相關問題