我使用awk(mac os x)僅打印n個字符或更長的行。awkåä?umlaut-chars的長度爲2
如果我嘗試在一個文本文件(strings.txt),看起來像這樣:
four
foo
bar
föö
bår
fo
ba
fö
bå
我運行這個awk腳本:
awk ' { if(length($0) >= 3) print $0 } ' <strings.txt
輸出是:
four
foo
bar
föö
bår
fö
bå
(最後兩行不應該打印)。看起來好像包含變音符(å,ä,ö...)的單詞計爲兩個字符。
(輸入文件保存在UTF8格式)。
所以問題是:是awk(特別是長度)Unicode識別? – 2011-09-28 04:59:20