我有兩個由bp間隔組成的表,Table1具有較大的間隔,第二個表具有較短的間隔(僅2bp)。我想創建一個只包含Table 1範圍的新表,它們的「大」範圍至少包含一個表2的元素。如果表2中沒有與表1範圍對應的元素,則不應包含表1中的該範圍。包含另一個表中至少一個元素的表的子集
在表1(df
)的本實施例中的行2(1, 600, 1500
)應不包括:
df <- "Chromosome start end
1 1 450
1 600 1500
2 3500 3585
2 7850 10000"
df <- read.table(text=df, header=T)
表2(df2
)
df2 <- "Chromosome start end
1 5 6
1 598 599
2 3580 3581
2 7851 7852
2 7859 7860"
df2 <- read.table(text=df2, header=T)
newtable的(dfout
):
dfout <- "Chromosome start end
1 1 450
2 3500 3585
2 7850 10000"
dfout <- read.table(text=df2, header=T)
您的具體問題是什麼?請參閱http://stackoverflow.com/help/how-to-ask您可能需要澄清如何包含或不包含項目的邏輯。這也有助於說出「bp」的含義。 – GreenGiant