2010-09-24 21 views

回答

11

Gnu sed應該能夠處理unicode。嘗試

$ echo 'Some StrAngÉ LeTTeRs 123' | sed -e 's/./\L\0/g' 
some strangé letters 123 
+0

您的解決方案不適用於土耳其人。它應該轉換爲ı而不是我https://en.wikipedia.org/wiki/Dotted_and_dotless_I – zwlayer 2017-10-19 05:27:55

2

如果你可以使用Python那麼這樣的代碼,可以幫助你:

import sys 
import codecs 

utf8input = codecs.getreader("utf-8")(sys.stdin) 
utf8output = codecs.getwriter("utf-8")(sys.stdout) 

utf8output.write(utf8input.read().lower()) 

在我的Windows機器(對不起:)我可以用它作爲過濾器:

cat big.txt | python tolowerutf8.py > lower.txt3 
+0

謝謝 - 也是一個很好的解決方案。 – lzap 2010-09-24 08:59:50

+2

這確實與'perl -CSD -ne'print lc''相比有很多代碼。 – tchrist 2012-03-22 23:32:39

相關問題