想知道如何處理下面的情況,樣本輸入用空格分隔,並且想要格式化爲逗號分隔的輸出。 直到以數字開頭的第一個字段爲止的所有文本都應視爲輸出中的單個字段。在示例數據中,行尾總是有3個數字字段;在實際數據中,有14個這樣的字段。awk處理未格式化的輸入
INPUT.TXT
mmm 4394850 4465411 2579770
xxx yyy 2155419 2178791 1516446
aaa bbb (incl. ccc) 14291585 14438704 6106341
U.U.(W) 6789781 6882021 5940226
nnn 7335050 7534302 2963345
試過下面的命令,但我知道它是不完整:
awk 'BEGIN {FS =" "; OFS = ","} {print $1,$2,$3,$4,$5,$6} ' Input.txt
所需的輸出:
mmm,4394850,4465411,2579770
xxx yyy,2155419,2178791,1516446
aaa bbb (incl. ccc),14291585,14438704,6106341
U.U.(W),6789781,6882021,5940226
nnn,7335050,7534302,2963345
。在你的企圖沒有邏輯,試圖應對處理數字領域不同。輸入始終是相同的格式?例如,每行的結尾總是有3個數字字段? –
Tom Fenech,每行末尾有14個數字字段 – VNA