我有一個數據集,其中包含特定位置(支架)上區段的初始位置和最終位置,如果在同一個支架中有一些segmens與其他區域重疊。R:使用R找到重疊區域
> head(jobs)
JOB_N Genome Scaffold loc_i loc_f
1 PRJNA179522 Contig10285 1251 1502
1 PRJNA179522 Contig10285 1251 1602
2 PRJNA179522 Contig10285 1255 1499
2 PRJNA179522 Contig10285 828 1076
2 PRJNA179522 Contig783 245 1487
2 PRJNA179522 Contig783 822 1073
我想要兩件事:第一個是找到所有單個腳手架中的所有重疊區域。 第二個是獲得一個新表,其中只包含每個「新」段的第一個和最後一個位置。輸出將是:
JOB_N Genome Scaffold loc_i loc_f
1 PRJNA179522 Contig10285 1251 1602
2 PRJNA179522 Contig10285 828 1076
2 PRJNA179522 Contig783 245 1487
在此先感謝。
參見'foverlaps'在'data.table'或'findOverlaps'在'IRanges' – MichaelChirico