我在unix系統上做了一些文本處理。我已經進入命令行本機上,它有Python和Perl和安裝的默認文字處理progams時,awk等刪除文件中的行
我有一個文本文件,它看起來象下面這樣:
2029754527851451717
2029754527851451717
2029754527851451717
2029754527851451717
2029754527851451717
2029754527851451717 1232453488239 Tue Mar 3 10:47:44 2009
2029754527851451717 1232453488302 Tue Mar 3 10:47:44 2009
2029754527851451717 1232453488365 Tue Mar 3 10:47:44 2009
2895635937120524206
2895635937120524206
2895635937120524206
2895635937120524206
2895635937120524206
2895635937120524206
5622983575622325494 1232453323986 Thu Feb 12 15:57:49 2009
這是基本上3行:ID ID日期
我期待刪除所有沒有2個ID和一個日期的行。因此,最終結果將如下所示:
2029754527851451717 1232453488239 Tue Mar 3 10:47:44 2009
2029754527851451717 1232453488302 Tue Mar 3 10:47:44 2009
2029754527851451717 1232453488365 Tue Mar 3 10:47:44 2009
5622983575622325494 1232453323986 Thu Feb 12 15:57:49 2009
您會如何建議您這樣做?文本文件總共大約30,000行。
乾杯
EEF
等價的perl存在:perl -i -wane'print if @F> 6'input_file> output_file – ysth 2009-04-27 15:25:00