比較awk中的連續行和多個列以及隨機選擇其中一個重複行

我讀過這個問題：Compare consecutive rows in awk/(or python) and random select one of duplicate lines。現在我有一些額外的問題：我應該如何更改代碼，如果我不想對x值進行比較，還需要對y值或更多的列進行比較？也許像比較awk中的連續行和多個列以及隨機選擇其中一個重複行

if ($1 != prev) && ($2 != prev) ???

換句話說：我想比較，如果x值和當前行的y值是相同的x值和下一個連續的y值線。

數據：

輸出應看起來像：

或（由於隨機選擇）

從上述鏈路的代碼，這並對於x值的東西，但不是在AND條件下的y值：

$ cat tst.awk 
function prtBuf(  idx) { 
    if (cnt > 0) { 
     idx = int((rand() * cnt) + 1) 
     print buf[idx] 
    } 
    cnt = 0 
} 

BEGIN { srand() } 
$1 != prev { prtBuf() } 
{ buf[++cnt]=$0; prev=$1 } 
END { prtBuf() }

來源

2016-07-22 Jojo

這應做到：

function prtBuf(idx) { 
    if (cnt > 0) { 
     idx = int((rand() * cnt) + 1) 
     print buf[idx] 
    } 
    cnt = 0 
} 

BEGIN { srand() } 
$1 != prev1 || $2 != prev2 { prtBuf() } 
{ buf[++cnt]=$0; prev1=$1; prev2=$2 } 
END { prtBuf() }

來源

2016-07-23 17:42:10

是的，這樣做吧！做得好！如果有人想爲更多的colums做這個比較，它也很容易改變。 3列的示例：BEGIN {srand（）} $ 1！= prev1 || $ 2！= prev2 || $ 3！= prev3 {prtBuf（）} {buf [++ cnt] = $ 0; prev1 = $ 1; prev2 = $ 2; prev3 = $ 3} END {prtBuf（）} – Jojo

比較awk中的連續行和多個列以及隨機選擇其中一個重複行

回答

相關問題