我有一個包含大量句子的數據文件,像這樣編碼:比較統一交涉符號
「吉布MIR BITTE的Erk \ u00e4ltung」
我也有一個包含大量關鍵詞的數據文件,像這樣編碼:
「Erkältung」
我想搜索在句子的關鍵詞,然後將它們寫入到一個文件,在「Erkältung」格式。
我將如何轉換\ u00e4到無需做:
與string.replace( '\ u00e4', 'A')
更確切地說,我想有這個返回匹配在Python 2.6:
(#coding:UTF-8)
sentence = "Gib mir bitte Erk\u00e4ltung"
keyword = "Erkältung"
re.search(keyword, line)
任何提示?
如果你需要做的是靜態文本字符串搜索,'在sentence'關鍵字通常是更好選擇比正則表達式。 –