我已經使用cummeRbund功能findSimilar()來找到與使用Cuffdiff鑑定的差異表達基因I最相似的10個基因。這使用了Jensen-Shannon距離,並生成了一個排序的有序基因列表,我現在要測試GO富集。該文件是這樣的:基因集富集分析
"XLOC_007917" 0
"XLOC_008881" 0.00417099861122699
"XLOC_017692" 0.0178758082512721
"XLOC_008901" 0.0180682577435933
"XLOC_014267" 0.0333227735282459
"XLOC_013408" 0.0400392521794019
"XLOC_013497" 0.0412541820119971
"XLOC_010554" 0.0453928603025379
"XLOC_000570" 0.0461264880687295
"XLOC_010786" 0.0469577467848723
我先手動搜索GO術語每個最相似的基因,但我想做一個更強大的分析。我試圖運行Broad Institute的Java應用程序GSEA。
我做了我的排名列表文件格式(* .rnk),現在我必須選擇一個基因集數據庫。
我正在研究海綿物種,所以我不能使用已經提供的數據庫。
如何創建我自己的基因集數據庫?它應該是什麼樣子?