我有一個keys
列表包括單詞。當我做這個命令:特殊的Unicode字符不會在Python 3中刪除
for key in keys:
print(key)
我在終端得到正常輸出。
但是當我打印使用print(keys)
整個列表,我得到這樣的輸出:
我一直在使用key.replace("\u202c", '')
,key.replace("\\u202c", '')
,re.sub(u'\u202c', '', key)
嘗試,但沒有解決的問題。 我也嘗試過的解決方案在這裏,但他們沒有工作之一:
Replacing a unicode character in a string in Python 3
Removing unicode \u2026 like characters in a string in python2.7
Python removing extra special unicode characters
How can I remove non-ASCII characters but leave periods and spaces using Python?
我用美麗的湯刮這從谷歌趨勢和檢索來自get_text()
的文本 也在Google Tr的頁面源代碼中結束頁,字列舉如下:
當我在這裏直接從網頁源代碼,沒有這些不尋常的符號粘貼文本粘貼文本
@OferSadan我只是嘗試這樣做,得到了相同的輸出中的問題。 –
生成後在列表中的每個項目上執行'sub(r'\ p {Block = General_Punctuation} +','')'。或者,您可以使用_block_的範圍'[\ u2000- \ u206F] +'。見https://www.compart.com/en/unicode/block/U+2000 – sln
另請參閱https://en.wikipedia.org/wiki/General_Punctuation – sln