在Bash中使用數組和Sed以及Awk解析文本文件

我看到一個複雜的文本文件，其中包含大約300個條目。我不知道如何去解析這個文件來獲得我想要的輸出。我的每個網絡用戶在文件中都有一個條目。在Bash中使用數組和Sed以及Awk解析文本文件

USER:martha 
USER:Othello 
USER:darwin

再下面，是我需要信息的主機文件中的每一用戶項，但一個用戶可以有一個入口，另一個可得：所以在文本文件中，每個用戶名稱開頭多個條目。下面是3個這樣的條目

USER:martha 
    POSITION: 170.198.82.13 [VLT(304394),PT(FULL)] 
      CLIENT: jcrm19.1.p2ps -258- 
      ACCESSPOINT: 170.198.82.13/net 
      APPLICATION: 91 

USER:othello 
    POSITION: 170.198.80.212 [VLT(307571),PT(FULL)] 
      CLIENT: jcrm15.1.p2ps -258- 
      ACCESSPOINT: 170.198.80.212/net 
      APPLICATION: 256 

      CLIENT: jcrm15.1.p2ps -258- 
      ACCESSPOINT: 170.198.80.212/net 
      APPLICATION: 256 

    POSITION: 170.198.80.209 [VLT(306561),PT(FULL)] 
      CLIENT: jcrm14.1.p2ps -258- 
      ACCESSPOINT: 170.198.80.209/net 
      APPLICATION: 256 

      CLIENT: pwrm14.1.p2ps -258- 
      ACCESSPOINT: 170.198.80.209/net 
      APPLICATION: 256 

      CLIENT: pwrm14.1.p2ps -258- 
      ACCESSPOINT: 170.198.80.209/net 
      APPLICATION: 256 


USER:darwin 
    POSITION: 170.198.19.102 [VLT(297987),PT(FULL)] 
      CLIENT: jcrm16.1.p2ps -258- 
      ACCESSPOINT: 170.198.19.102/net 
      APPLICATION: 91

最終的輸出應如下的例子：

USER  Position   Client  Application 

Martha  170.198.82.13  jcrm19  91 
Othello  170.198.80.212  jcrm15  256 
Othello  170.198.80.209  jcrm14  256 
Martin  170.198.19.102  jcrm16  91

我有數組的一些經驗，我可以用grep出一些信息，並分配給變量，打印它們。但我不知道如何將信息讀入陣列，作爲每個「USER」下的條目，因爲它們具有不同的長度和內容。

所以我怎麼讀用戶：martha然後跳轉到用戶：othello？此外，在用戶：othello有兩個「位置」，我需要抓住。我只是不知道如何把我正在尋找的內容放入數組變量或常規變量中。我從來不必解析每次使用時長度和內容數據不同的文件。不知道在我開始閱讀和爲下一個用戶分配數值或值之前，我必須閱讀多少行>能否提供一些提示或可能是我可以從頭開始的一段代碼？

感謝

來源

2014-05-13 theuniverseisflat

我沒有得到我的Mac出手，所以這是未經測試...

awk -F: '/^USER:/{u=$2} /POSITION:/{p=$2} /CLIENT:/{c=$2} /APPLICATION:/{print u,p,c,$2}' yourfile

來源

2014-05-13 20:30:58

OP只是想用'POSITION'來選擇塊，你打印每個塊的條目 – Kent

@Kent哦，是的，你說得對，謝謝。我會讓他選擇你和anubhava的答案。 –

嗨馬克。我試過你的班輪，工作很好。不知道它如何工作，但它的工作原理。所以謝謝。我真的必須瞭解這個職位的工作原理。當我將它與原始日誌文件進行對比時，它也生成了額外的數據列......但這很好。/ – theuniverseisflat

使用awk與column：

awk -F '[: ]+' 'BEGIN{print "USER", "Position", "Client", "Application"} 
    $1=="USER"{u=$2} $2=="POSITION"{p=$3}$2=="CLIENT"{c=$3} 
    $2=="APPLICATION"&&p{print u, p, c, $3; p=""}' file | column -t 

USER  Position  Client   Application 
martha 170.198.82.13 jcrm19.1.p2ps 91 
othello 170.198.80.212 jcrm15.1.p2ps 256 
othello 170.198.80.209 jcrm14.1.p2ps 256 
darwin 170.198.19.102 jcrm16.1.p2ps 91

來源

2014-05-13 20:27:18 anubhava

這假設領域始終處於樣品中的順序。這可能是正確的，但應該指出。 –

嗨thx ..我試過這個。是的，這些字段總是按照這個順序。它適用於我提供的示例，而不是與我擁有的文本文件。不知道爲什麼。我必須再次查看日誌文件。 Thx快速響應。將不得不看晚，因爲我必須跑再次趕上火車thx！ anubhava – theuniverseisflat

當然，讓我知道你是否需要進一步的幫助。 – anubhava

awk -v RS="" -F'[:\n ]*' '/^USER/{u=$2} 
/POSI/{p=/^USER/?$4:$3 
for(i=1;i<=NF;i++) 
    if($i=="CLIENT"){sub(/\..*/,"",$(i+1)) 
         print u,p,$(i+1),$NF;break}}' file

輸出，而不標題：

martha 170.198.82.13 jcrm19 91 
othello 170.198.80.212 jcrm15 256 
othello 170.198.80.209 jcrm14 256 
darwin 170.198.19.102 jcrm16 91

您可以添加標題和管column -t，以獲得更好的格式

來源

2014-05-13 20:43:16 Kent

嗨，肯特。感謝您的回覆。對不起，我從來沒有讀過這篇文章。我試過我們的代碼，它什麼都不做。它不會產生錯誤，並且不會產生任何輸出？ – theuniverseisflat

在Bash中使用數組和Sed以及Awk解析文本文件

回答

相關問題