2
我需要找到韓文字符的組成部分。例如。我想在한find找到ㅏ。有與Perl兼容的正則表達式做到這一點的方法嗎?我可以搜索Hangul的分解形式嗎?
我需要找到韓文字符的組成部分。例如。我想在한find找到ㅏ。有與Perl兼容的正則表達式做到這一點的方法嗎?我可以搜索Hangul的分解形式嗎?
使用Unicode block\p{InHangul_Compatibility_Jamo}
(U + 3130 - U + 318F)。
的Python 3.x的例子(使用第三方regex
模塊):
>>> import regex
>>> regex.findall(r'\p{InHangul_Compatibility_Jamo}', '한ㅎㅏㄴ글')
['ㅎ', 'ㅏ', 'ㄴ']
>>> regex.findall(r'[\u3130-\u318f]', '한ㅎㅏㄴ글')
['ㅎ', 'ㅏ', 'ㄴ']