我想知道如何從包含超過特定數量的字符的數據集中刪除行,這取決於兩行的總和。根據字符數刪除行
例如,在以下數據:
2 rs121065 0 17696224 T C
2 rs1860485 0 17696230 T C
2 rs237147 0 17696256 C CGAGGCAG
2 rs1909633 0 17696365 A G
2 rs574724 0 17696368 T C
我想刪除的第三行。問題是,該系列的字母是可變的,因此,在其他地方,該數據可能看起來像這樣:
2 rs113308 0 17683654 CCTTT C
或本:
2 rs103371 0 17667279 TG T
所以 - 基本上,任何一行包含多個比最後兩個欄2個字符需要被刪除,最好我的數據集將是這樣的:
2 rs121065 0 17696224 T C
2 rs1860485 0 17696230 T C
2 rs1909633 0 17696365 A G
2 rs574724 0 17696368 T C
任何建議都非常感謝!
當你說「超過2個字符」這是否意味着你要保持有2個字符的一列的列?即你真的是指「超過1個字符?」 – GSee
在總計最後2列之前刪除包含多於1個字符的行,或者在總和之後多於2個字符。 – mfk534