6
通常希望列出給定Unicode類別中的所有字符。例如:高效地列出給定Unicode類別中的所有字符
- List all Unicode whitespace,How can I get all whitespaces in UTF-8 in Python?
- Characters with the property
Alphabetic
,能夠產生該列表通過遍歷所有Unicode碼點和測試所需的類別(Python 3中):
[c for c in map(chr, range(0x110000)) if unicodedata.category(c) in ('Ll',)]
或使用正則表達式,
re.findall(r'\s', ''.join(map(chr, range(0x110000))))
但是這些方法很慢。有沒有辦法查找類別中的字符列表,而無需遍歷所有的字符?
Perl的相關問題:How do I get a list of all Unicode characters that have a given property?
應該用map() –
@ m.kocikowski中的unichr()替換chr():除非您使用的是Python 3,問題的OP明確表示(否則在Python 2中會失敗)。 –