2017-06-28 75 views
-2

我有一個包含以下行的文件:骨料線和總結列

01323874;291874;-;000000000000003030;2511011999;-;000000000000000000 
01323874;291874;-;000000000012920840;2511011999;+;000002910023874000 
01323872;291872;-;000000000000008750;2511011999;-;000000000000008750 
01323872;291872;+;000000000609396980;   ;+;000000000000000000 
01323778;  ;-;000000000468442930;   ;+;000000000000000000 
01323778;  ;+;000000005166500460;   ;+;000000000000000000 
01323778;  ;-;000000000469421100;2511021000;+;000000000469421100 
01323778;291778;-;000000000361156930;2511021000;-;000000000361156930 
01323778;  ;-;000000000186088530;2511021000;+;000000000186088530 
01323778;291778;-;000000000017602470;2511021000;-;000000000017602470 

我想基於第一列集合線路:

總結一下列的值4,考慮到第3列中的符號(+/-)。

總結列7的值,考慮第6列中的符號(+/-)。

01323874;291874;-;000000000012923871;2511011999;+;000002910023874000 
01323872;291872;+;000000000609388230;2511011999;-;000000000000008750 
01323778;291778;+;000000003663788500;2511021000;+;000000000276750230 

我已經成功生成格式良好的行,但找不到方法來聚合它們。您的幫助將非常感激。

+1

還有,你試過這麼遠嗎? – sjsam

+0

首先在這裏發佈你已經完成的代碼。 –

+1

colums 2和5呢? –

回答

4
kent$ cat f 
01323874;291874;-;000000000000003030;2511011999;-;000000000000000000 
01323874;291874;-;000000000012920840;2511011999;+;000002910023874000 
01323872;291872;-;000000000000008750;2511011999;-;000000000000008750 
01323872;291872;+;000000000609396980;   ;+;000000000000000000 
01323778;  ;-;000000000468442930;   ;+;000000000000000000 
01323778;  ;+;000000005166500460;   ;+;000000000000000000 
01323778;  ;-;000000000469421100;2511021000;+;000000000469421100 
01323778;291778;-;000000000361156930;2511021000;-;000000000361156930 
01323778;  ;-;000000000186088530;2511021000;+;000000000186088530 
01323778;291778;-;000000000017602470;2511021000;-;000000000017602470 

輸出

kent$ awk -F';' '{a[$1]=(1*$2?$2:a[$1]); b[$1]+=$3=="-"?-$4:$4; 
        c[$1]=(1*$5?$5:c[$1]); d[$1]+=$6=="-"?-$7:$7} 
     END{for(x in a) 
       printf "%s;%s;%s;%018d;%s;%s;%018d\n", 
         x,a[x], 
         (b[x]>0?"+":"-"),(b[x]<0?-b[x]:b[x]),c[x], 
         (d[x]>0?"+":"-"),(d[x]<0?-d[x]:d[x])}' f 
01323872;291872;+;000000000609388230;2511011999;-;000000000000008750 
01323778;291778;+;000000003663788500;2511021000;+;000000000276750230 
01323874;291874;-;000000000012923870;2511011999;+;000002910023874000 
+0

只是爲了我個人的知識 - 那裏有'1 *'的目的是什麼? – fzd

+1

@fzd你會看到如果你從代碼中刪除它。它過濾掉黑色但不是空的字符串。就像'「」' – Kent

+0

@ kent它可以正常工作,但它並不處理第2或第5列只包含空格的情況。例如現在我得到'01323872; 291872; +; 000000000609388230 ;; - ;; 000000000000008750',但它應該是'01323872; 291872; +; 000000000609388230; BLANK SPACE; - ; 000000000000008750' – technopathe

0

AWK溶液:

awk -F';' 'function get_sign(n){ 
       return (n<0)? "-":"+" 
      } 
      { 
       a[$1]+=int($3$4); b[$1]+=int($6$7); 
       if ($2*1) fld2[$1]=$2; if ($5*1) fld5[$1]=$5 
      } 
      END{ 
       for(i in a) print i, fld2[i], get_sign(a[i]), 
       sprintf("%018d",(a[i]>0)? a[i]:a[i]*-1), fld5[i], get_sign(b[i]), 
       sprintf("%018d",(b[i]>0)? b[i]:b[i]*-1) 
      }' OFS=';' file 

輸出:

01323872;291872;+;000000000609388230;2511011999;-;000000000000008750 
01323778;291778;+;000000003663788500;2511021000;+;000000000276750230 
01323874;291874;-;000000000012923870;2511011999;+;000002910023874000 

  • function get_sign(n) { ... } - 函數,定義數值參數n是正還是負,並返回各自的標誌
+0

它可以正常工作,但它並不處理第2列或第5列僅包含空格的情況。例如現在我得到'01323872; 291872; +; 000000000609388230 ;; - ;; 000000000000008750',但它應該是'01323872; 291872; +; 000000000609388230; BLANK SPACE; - ; 000000000000008750' – technopathe

+0

@technopathe,事實並非如此。我已經測試了這種情況,當第二列只包含空格時,它給了我:'01323872 ;; + +; 000000000609388230; 2511011999; - ; 000000000000870012 01323778 ;; +; 000000003663788500; 2511021000; +; 000000000276750230 01323874 ;; - ; 000000000012923870; 2511011999; +; 000002910023874000 '如預期的那樣 – RomanPerekhrest

+0

其實我寧可用這種方式打印空白; *********;比這個方式;; *指白色空間 – technopathe