2009-11-30 24 views
5

如何在Awk中正確讀取UTF8以外的編碼文件?如何使用Awk讀取不同編碼的文件?

我有一個希伯來語/ Windows-1255編碼的文件。 一個簡單的{print $ 0} awk打印像 這樣的東西。 我該如何讓它正確讀取?

+1

這很可能與你的終端一樣,與awk一樣多。 – 2009-11-30 16:00:01

回答

6

awk本身不支持處理不同的編碼。它將遵守環境中指定的語言環境,但最好的辦法是在將輸入交給awk之前將輸入轉碼爲正確的編碼。

-f是要轉換的格式,-t是目標格式,-c跳過過早終止iconv操作的任何無效字符。當然 - 幫助會提供更多細節。

iconv -c -f cp1255 -t utf8 somefile | awk ... 
+0

很酷。謝謝。 (填充字符....) – 2009-11-30 16:56:31

相關問題