因此,我有超過480000行和1380列的此文件。 如果第二行的值是Sex:Female或Sex:Male,那麼我需要一個將F_或M_添加到第一行值的流水線。Perl,基於secod行中的值更改第一行中的值,
我文件中的第一行基本上是個別的ids,後面跟着單元格類型-N或-G。第二行指出該個體是女性還是男性,其餘的行是第一列中的probe_Ids,其他列是他們對應每個人的beta_value。如果這會更有意義,我會添加以下幾行。
我的輸入文件是這樣的(製表符分隔)沒有第一列。
1740-N 1546-N 1546-G 1740-G 1228-G 5121-N 5121-G
Sex: Female Sex: Female Sex: Female Sex: Female Sex: Male Sex: Female Sex: Female
我的輸出應該是這樣的(製表符分隔),而第一列
F_1740-N F_1546-N F_1546-G F_1740-G M_1228-G F_5121-N F_5121-G
注意性別線不被輸出。
任何人都可以幫忙嗎?如果我的列數很少,我會手動執行。
這可以在任何程序中完成;我不堅持perl
這是整個文件中每個文件或配對行的第一行和第二行嗎? –
它們都在一個文件中。第二行是第一行的決定因素,但我不需要兩者都只需要一個作爲標題。這爲我節省了太多時間。 – user2997397
我的意思是這只是文件中的第一行和第二行,而不是文件中的多個位置對,但聽起來像是這樣。 –