我有一個這樣的文件:如何刪除除換行符之外的所有非單詞字符?
my line - some words & text
oh lóok i've got some characters
我想「正常化」,並刪除所有非單詞字符。我想這樣的事情結束了:
mylinesomewordstext
ohlóokivegotsomecharacters
我此刻的命令行中使用Linux,而我希望能有一些一班輪我可以使用。
我嘗試這樣做:
cat file | perl -pe 's/\W//'
但是,刪除所有的換行,把一切一行。有什麼我可以告訴Perl不要在\W
中包含換行符?或者有其他方法嗎?
這會在原始文本中刪除帶重音符號的o。 – 2009-09-09 11:24:33
您必須在命令中添加一個標誌才能使其具有Unicode意識-C應該這樣做。 http://perldoc.perl.org/perlrun.html#Command-Switches – 2009-09-09 12:37:34
對,改變了。 – sth 2009-09-09 13:18:52