我需要使用python腳本從某些字符串中刪除表情符號。我發現已經有人問過這個question,答案的一個標記爲成功,即下面的代碼會做的伎倆:從python字符串中刪除emojis
#!/usr/bin/env python
import re
text = u'This dog \U0001f602'
print(text) # with emoji
emoji_pattern = re.compile("["
u"\U0001F600-\U0001F64F" # emoticons
u"\U0001F300-\U0001F5FF" # symbols & pictographs
u"\U0001F680-\U0001F6FF" # transport & map symbols
u"\U0001F1E0-\U0001F1FF" # flags (iOS)
"]+", flags=re.UNICODE)
print(emoji_pattern.sub(r'', text)) # no emoji
我插入這個代碼到我的劇本,並改變了它只能是在我的代碼而不是示例文本中對字符串進行操作。當我運行的代碼,但是,我得到了一些錯誤,我不明白:
Traceback (most recent call last):
File "SCRIPT.py", line 31, in get_tweets
"]+", flags=re.UNICODE)
File "/usr/local/Cellar/python/2.7.12/Frameworks/Python.framework /Versions/2.7/lib/python2.7/re.py", line 194, in compile
return _compile(pattern, flags)
File "/usr/local/Cellar/python/2.7.12/Frameworks/Python.framework/Versions/2.7/lib/python2.7/re.py", line 251, in _compile
raise error, v # invalid expression
sre_constants.error: bad character range
我得到了錯誤的說法,但因爲我一把抓起Stackexchange這個代碼,我想不通爲什麼它顯然奏效對於這個討論中的人們而言,不適合我。如果有幫助,我使用Python 2.7。謝謝!
'sys.maxunicode'說? –