使用正則表達式與語言環境和UNICODE標誌我想用Python語言編寫,測試腳本,英寸測試空白在Python
- 我給在ASCII以外區域具有不同組的空白字符和字符串然後使用'\ s'與
re.LOCALE
標誌查看輸出。 - 我也想補充一下。我想
\S
並查看該LOCALE返回的非空白字符。
現在,我怎麼能做到這一點?我應該選擇哪一個LOCALE來查看ASCII輸出的明顯差異。
# -*- Proper encoding -*-
import re
pat = re.compile('\s*', re.LOCALE)
string = "string" # Proper Replacement String?
result = pat.match(string)
print result.group(0)
我使用的是Ubuntu,接下來是我的shell的當前語言環境。
$locale
LANG=en_SG.UTF-8
LANGUAGE=en_SG:en
LC_CTYPE="en_SG.UTF-8"
LC_NUMERIC="en_SG.UTF-8"
LC_TIME="en_SG.UTF-8"
LC_COLLATE="en_SG.UTF-8"
LC_MONETARY="en_SG.UTF-8"
LC_MESSAGES="en_SG.UTF-8"
LC_PAPER="en_SG.UTF-8"
LC_NAME="en_SG.UTF-8"
LC_ADDRESS="en_SG.UTF-8"
LC_TELEPHONE="en_SG.UTF-8"
LC_MEASUREMENT="en_SG.UTF-8"
LC_IDENTIFICATION="en_SG.UTF-8"
LC_ALL=
順便說一句,我對UNICODE或LOCALE感知輸入/輸出(如果有的話)的經驗較少。我所知道的是,我可以在終端上使用代碼點輸入unicode字母。
什麼是可能的輸入,以及該輸入的期望輸出是什麼? – apple16 2012-04-03 22:44:25
輸入將是一個帶有區域設置字母的字符串,輸出將與正則表達式匹配。 – 2012-04-03 23:41:22