2
我有一個固定寬度的文件,有一些非UTF8字符,我想用空格替換非UTF8字符。如何用空格替換無效的UTF8字符
我試圖運行iconv -f utf8 -t utf8 -c $file
但它做的唯一一件事就是刪除非UTF8字符。使用iconv無法用空格替換它們。
我想要一個korn shell腳本/ Perl腳本來替換所有非UTF8字符的空格。
我發現這個Perl腳本打印非UTF8字符被發現的行,但我不知道任何關於Perl的東西,使它用空格替換非UTF8。
perl -l -ne '/
^([\000-\177] # 1-byte pattern
|[\300-\337][\200-\277] # 2-byte pattern
|[\340-\357][\200-\277]{2} # 3-byte pattern
|[\360-\367][\200-\277]{3} # 4-byte pattern
|[\370-\373][\200-\277]{4} # 5-byte pattern
|[\374-\375][\200-\277]{5} # 6-byte pattern
)*$ /x or print' FILE.dat
環境AIX