剝離了在Python代碼我讀到這樣的: Stripping everything but alphanumeric chars from a string in Python使用「應用re.sub」
這: Python: Strip everything but spaces and alphanumeric
聽不太懂,但我想我自己的代碼,它現在有點看起來是這樣的:
import re
decrypt = str(open("crypt.txt"))
crypt = re.sub(r'([^\s\w]|_)+', '', decrypt)
print(crypt)
當我運行該腳本,它回來了這樣的回答: C:\用戶\阿德里安\桌面\蟒蛇>蟒蛇tick.py ioTextIOWrapper namecrypttxt莫代爾encodingcp1252
我試圖從文檔中獲得了所有的額外代碼,並只保留數字和字母,文件下面的文本,可以發現裏面:http://pastebin.com/Hj3SjhxC
我想解決這裏的任務: http://www.pythonchallenge.com/pc/def/ocr.html
任何人都知道「ioTextIraprapper namecrypttxt moder encodingcp1252」是什麼意思? 我應該如何格式化代碼以正確地將它從除字母和數字之外的所有東西中剝離出來?
真誠
你應該也與此標記'regex' – jackcogdill