因此,我在Python中使用了這個字符串str = u'world-weather-online®_jkpahjicmehopmlkbenbkmckcedlcmhk'
,我只是想用正則表達式提取world-weather-online®
的一部分。我所做的是第一個match = re.search(r'([a-zA-Z0-9\-\%\+]+?)_[a-z]+', str)
,然後在字符串str2 = match.group(1)
中得到結果。如何處理在Python中具有unicode的正則表達式?
但是,我結束了錯誤'NoneType' object has no attribute 'group'
。如果我只是用字符串「world-weather-online_jkpahjicmehopmlkbenbkmckcedlcmhk」來嘗試它,它就可以正常工作。但是,擁有特殊的unicode符號會產生問題。我嘗試使用match = re.search(ur'([a-zA-Z0-9\-\%\+]+?)_[a-z]+', str)
,但它仍然沒有幫助。關於如何解決這個問題的任何想法?謝謝!
你的意思是你有一個*字節串*同是ASCII範圍之外的代碼點?或者你有* unicode *字符串對象('u'world-weather-online®_jkpahjicmehopmlkbenbkmckcedlcmhk')? –
沒有*特殊的Unicode符號*;所有文本都是unicode代碼點,其中大部分都在ASCII範圍內。 –
我有一個Unicode字符串對象。 – TheRookierLearner