我有這樣的代碼:如何在非ASCII字符串中使用正則表達式?
opendir(DIR, ".");
while (readdir DIR) {
print $1, "\n" if $_ =~ /(\w+)/i;
}
它當然是唯一的ASCII字符串。如何使用regexp在輸出中獲得另一個非ASCII字符串?
UPD
例如,如果在 「」。目錄中有兩個文件file
和другойфайл
。所以,當我運行此腳本我在輸出中只得到file
但我想獲得其他文件使用非英文名稱другойфайл
當然,什麼?爲什麼它只能得到ASCII字符串? – bmargulies 2013-02-12 22:49:41
'\ w +'是字母數字字符。你可以用'\ W +'來取消字符類。 – TLP 2013-02-12 22:54:42
那麼我想解析的不僅僅是英文文件的名稱。我在UPD中寫過關於它的內容。 – edem 2013-02-12 23:08:36