我工作的RNA序列數據,並試圖通過基因型繪製平均覆蓋率曲線,類似於什麼都是在這裏完成每基因型GenomicRanges添加覆蓋
RNA測序覆蓋率(來源:pickrell等,Nature,2010 )
要做到這一點的情節,我已經從100個個人要人文件,包含從RNA-seq的數據覆蓋信息(在特定區域),並且我在R讀取,如GenomicRanges對象。
這給了我GRANGES對象,如在下面的實施例玩具得到的那些:
GR1 = GRANGES(seqname的= 1,範圍= IRanges(開始= C(1,5,10,15,30 ,55),端= C(4,9,14,29,39,60)))
GR1 $ COV = C(3,1,8,6,2,10)
GR2 = GRANGES(seqname的= 1,範圍= IRanges(開始= C(3,20,24),結束= C(7,23,26)))
GR2 $ COV = C(3,5,3)
開始=唯一的(排序(C(範圍(GR1)@開始,範圍(GR2)@啓動)))
GR1
GRanges object with 6 ranges and 1 metadata column:
seqnames ranges strand | cov
<Rle> <IRanges> <Rle> | <numeric>
1 [ 1, 4] * | 3
1 [ 5, 9] * | 1
1 [10, 14] * | 8
1 [15, 29] * | 6
1 [30, 39] * | 2
1 [55, 60] * | 10
-------
seqinfo: 1 sequence from an unspecified genome; no seqlengths
GR2
GRanges object with 3 ranges and 1 metadata column:
seqnames ranges strand | cov
<Rle> <IRanges> <Rle> | <numeric>
1 [ 3, 7] * | 3
1 [20, 23] * | 5
1 [24, 26] * | 3
-------
seqinfo: 1 sequence from an unspecified genome; no seqlengths
問題是,我有這些每個人(gr1和gr2將2個不同的個人),我想結合他們創造基因組範圍的對象,它給我的全覆蓋,在不同個體,1和2 會看,因爲每個位置如下:
GR3
GRanges object with 6 ranges and 1 metadata column:
seqnames ranges strand | cov
<Rle> <IRanges> <Rle> | <numeric>
1 [ 1, 2] * | 3
1 [ 3, 4] * | 6 (=3+3)
1 [ 5, 7] * | 4 (=1+3)
1 [ 8, 9] * | 1
1 [10, 14] * | 8
1 [15, 19] * | 6
1 [20, 23] * | 11 (=6+5)
1 [24, 26] * | 9 (=6+3)
1 [27, 29] * | 6
1 [30, 39] * | 2
1 [55, 60] * | 10
有誰知道一個簡單的方法這個 ?或者我註定了?
感謝您的回答。
PS: 我的數據並沒有擱淺,但如果你有它的滯留數據,它會更好。
PPS:理想情況下,我還希望能夠進行乘法運算,或者應用帶有兩個參數x和y的任何函數,而不是簡單地添加覆蓋範圍。