似乎有很多關於在其他語言中這樣做的帖子,但我似乎無法弄清楚如何在Python中(我使用2.7)。替換或刪除python中的特定unicode字符
爲了清楚起見,我希望將字符串保存爲unicode,只需要替換某些特定的字符即可。
例如:
thisToken = u'tandh\u2013bm'
print(thisToken)
打印在中間的m破折號字。我只想刪除m-dash。 (但不使用索引,因爲我希望能夠做到這一點的任何地方我發現這些特定的字符。)
我嘗試使用replace
就像你使用任何其他字符:
newToke = thisToken.replace('\u2013','')
print(newToke)
但只是不起作用。任何幫助深表感謝。 Seth
,如果你在你的文件的頂部使用'從__future__進口unicode_literals',所有的字符串文字自動unicode的,這將在這裏幫助(但要注意的驚喜,當一些字符串必須是字節,可以使用的'b'前綴)。 – RemcoGerlich