我需要從文本文件中刪除所有網址。我讀取文件,我一行一行地迭代,然後寫一個乾淨的文件。但是下面的代碼很奇怪。它刪除原始文件的第一行,並總共添加新的3行。最重要的是它不會刪除網址。從文本文件中刪除網址
import sys
import re
sys.stdout = open('text_clean.txt', 'w')
with open("text.txt",encoding="'Latin-1'") as f:
rep = re.compile(r"""
http[s]?://.*?\s
|www.*?\s
|(\n)
""", re.X)
non_asc = re.compile(r"[^\x00-\x7F]")
for line in f:
non = non_asc.search(line)
if non:
continue
m = rep.search(line)
if m:
line = line.replace(m.group(), "")
if line.strip():
print(line.strip())
你爲什麼要覆蓋stdout?你不需要那個 –