2009-05-22 42 views

回答

6

使用西班牙語區域設置,使您的正則表達式區分大小寫。

1

你的正則表達式系統應該有一些等同於Python的re.L(又名re.LOCALE)做一個正則表達式語言環境相關的,所以什麼是文字字符,什麼是不與區域的變化,因爲這樣做「字邊界」等。你是否要求一種方式來補償一些給定的正則表達式系統而不是支持區域設置,試圖強制這個問題......?

1

這很大程度上取決於您正在使用的語言(和正則表達式引擎)。

在Perl中,\w匹配所有單詞字符,不管語言或字母表如何,類似於/\b(\w+)\b/的內容可能(可能)匹配西班牙語單詞以及英語單詞或俄語單詞。

在使用PCRE的語言中,\w(因此可能是\b)不匹配Unicode字符。你可能需要建立你自己的設置。我建議像[\wáéíóúñ]這樣的東西(匹配所有的單詞字符,加上你想要的重音字符),並且在甚至可以工作之前,PCRE庫必須用Unicode支持預先構建。

如果您使用別的東西,祝您好運。一些正則表達式引擎甚至不支持Unicode。

相關問題