0
我想刪除僅包含包含推文的文字的數據中的表情符號。每條線對應一條推文。 「:)」出現錯誤的字符錯誤。從推文中刪除表情符號(不是表情符號!)字符串
error: bad character range :-) at position 4
出了什麼問題?
#remove emoticons
import re
emoji_pattern = re.compile("["
u":)"
u":-)"
u":D"
u":("
u":-("
"]+", flags=re.UNICODE)
with open('C:/Users/M/PycharmProjects/Bachelor_Thesis/test/data_sentiment.csv',"r", encoding="utf-8") as oldfile1, open('C:/Users/M/PycharmProjects/Bachelor_Thesis/test/data_sentiment_stripped_emoticons.csv', 'w',encoding="utf-8") as newfile1:
for line in oldfile1:
line=emoji_pattern.sub(r'', line)
newfile1.write(line)
newfile1.close()
您正則表達式有一些嚴重的問題 –
請在你的問題真正的錯誤消息。有許多事情可以成爲問題;目前還不清楚你問的是哪一個。 –
@AmeyYadav:如何解決它? –