我有一個.CSV文件,它在一個標題之後有很少的記錄,但是,在結束之前有一個重複的標題的文件,然後重複的頭是幾個更多的記錄(我不需要)。有沒有辦法可以檢查第二次出現的標題的模式,並在重複的標題之後刪除文件的其餘部分?以下是該文件的示例。如何刪除一個在.CSV文件中第二次出現的模式後的其餘記錄
COL0,COL1,COL2,COL3,COL4,COL5,COL6,
1value0,1value1,1value2,1value3,1value4,1value5,1value6,
2value0,2value1,2value2,2value3,2value4,2value5, 2value6,
3value,3value1,3value2,3value3,3value4,3value5,3value6,
2value0,4value1,4value2,4value3,4value4,4value5,4value6,
5value0,5value1,5value2,5value3,5value4,5value5,5value6,
6值0,6值1,6值2,6值3,6值4,6值5,6值6,
,,,,,,,
,,,,,,,
,,,,,,,
第(n-1)value0,(N-1)值1,第(n-1)值2,( (n)value3,(n-1)value4,(n-1)value5,(n-1)value6,
(n)value0,(n)value1,(n)value2,(n)value3,( n)的值4,(n)的值5,(n)的value6,
COL0,COL1,COL2,COL3,COL4,COL5,COL6,
1,不需要的,記錄,之後,,複製,頭
2,不想要的,記錄,之後,複製標題
3,不需要的記錄,之後,複製標題
這裏說我期待的輸出如下所示
COL0,COL1,COL2,COL3,COL4,COL5,COL6,
1value0,1value1,1value2,1value3,1value4,1value5,1value6,
2value0,2value1,2value2,2value3,2value4,2value5,2value6,
3value,3value1,3value2,3value3,3value4,3value5,3value6,
2value0,4value1,4value2,4value3,4value4,4value5,4value6,
5value0 ,5值1,5值2,5值3,5值4,5值5,5值6,
6value0,6value1,6value2,6value3,6value4,6value5,6value6,
,,,,,,,
,,,,,,,
,,,,,,,
第(n-1) (n-1)值1,(n-1)值2,(n-1)值3,(n-1)值4,(n-1)值5,(n-1)值6,
(n)value0 ,(n)的值1,(n)的值2,(n)的值3,(n)的值4,(n)的值5,(n)的value6,
PS:我有GNU sed的版本4.1.5和GNU awk中3.1.5
任何幫助,高度讚賞。
旨在是從最初的一個不同的第二報頭(缺少「COL0」),所以這只是一個部分匹配,或者這只是一個錯字? – fileunderwater
對不起,他們都是一樣的......我只是檢查並糾正它..謝謝你 – Dhruuv
隨時upvote或接受你覺得有幫助的答案。 – fileunderwater