嗯,我想要基於每個文件共享的第一列並排加入114個文件,這是ID編號。每個文件由2列和400000多行組成。我用write.table
將這些表格連接在一張表格中,並在頭文件中獲得了X。例如,我的頭應該是這樣的:改變標題的SED命令
ID 1_sample1 2_sample2 3_sample3
,但我得到這樣的:
ID X1_sample1 X2_sample2 X3_sample3
我讀到這個問題,並發現了check.names
擺脫這個問題的,但對我來說當我使用check.names
我得到以下錯誤:
"unused argument (check.name = F)"
因此,我決定用sed來解決這個問題,它實際上的偉大工程,但它加入了2號線和1號線。例如,我的第一欄和第二欄應該是這樣的:
ID 1_sample1 2_sample2 3_sample
cg123 .0235 2.156 -5.546
,但我得到,而不是執行以下操作:
ID 1_sample1 2_sample2 3_sample cg123 .0235 2.156 -5.546
任何一個可以檢查這個代碼給我,謝謝。我可能做了一些錯誤的事情,不讓每條線與另一條線分開。
head -n 1 inFILE | tr "\t" "\n" | sed -e 's/^X//g' | sed -e 's/\./-/' | sed -e 's/\./(/' |sed -e 's/\./)/' | tr "\n" "\t" > outFILE
tail -n +2 beta.norm.txt >> outFILE
嘗試改善您的拼寫和您的格式,確保我們能理解你的意思。另外,一些示例輸入和期望的輸出將會很有幫助。 – fedorqui
改進的格式將有所幫助,但肯定有一種方法可以在R中正確完成要查找的內容。你可以分享一些實際的數據(粘貼'dput(head(yourdata)'')的結果)。 – Justin
多個字段的文本處理通常最容易使用'awk'完成。顯示一個「輸入行」和「所需的輸出行」,解釋你想達到的差異,你會得到一些很好的答案。 – Floris