我有一個包含類似數據的文件:搜索的行中的特定字段文件
0000380000000101
0000650000000201
0000650000000301
0000650000000401
0001000000000101
0001000000000201
....等等。我想處理這些數據,讓我得到這樣
000065 0000000201 0000000301 0000000401
000100 0000000101 0000000201
由於000065的輸出重複3次,在輸出我想000065只出現一次,而在每個條目對應的字節只要發生000065應打印。因爲,000038只有一次,我不想要這個輸出。在這個例子中,數據(即000065或000038碰巧是3個字節,儘管它可以是任何長度,而像0000000401之後的字節將是固定長度,即5個字節)。我想要最好使用shell腳本或c。請讓我知道我該怎麼做。 awk可以在這裏有所幫助嗎? 任何幫助將不勝感激。下面是實際的文件所採取的數據,我想的過程:
0000000000000101
0000000000000201
0000000000000301
0000000000000401
0000380000000101
0000650000000201
0000650000000301
0000650000000401
0001000000000101
0001000000000201
0001000000000301
0001000000000401
0038d30000000101
00652e0000000201
00652e0000000301
00652e0000000401
008d750000000101
008d750000000201
008d750000000301
008d750000000401
0100010000000101
0100010000000201
0100010000000301
0100010000000401
01008d0000000101
01008d0000000201
01008d0000000301
01008d0000000401
01a8c00000000101
01a8c00000000201
01a8c00000000301
01a8c00000000401
0264010000000101
0264010000000201
0264010000000301
0264010000000401
0615df0000000101
0615df0000000201
0615df0000000301
0615df0000000401
07dd940000000101
07dd940000000201
07dd940000000301
07dd940000000401
0900000000000101
0900000000000201
0900000000000301
0900000000000401
15dfc70000000101
15dfc70000000201
15dfc70000000301
15dfc70000000401
1ecf090000000101
[UUOC](https://en.wikipedia.org/wiki/Cat_(Unix)#Useless_use_of_cat)alert! – 2012-03-13 12:50:08
你是一位awk高手! – 2012-03-13 12:51:39
在Mac上沒有幫我工作 – anubhava 2012-03-13 12:55:52