我有一個文本的URL看起來像這樣:Python的 - 從文本與正則表達式移除網址
<https://buy.itunes.apple.com/WebObjects/MZFinance.woa/wa/reportAProblem?p
=22000073760328&o=i>
我用下面的模式,試圖刪除它們:
re.sub(r'\<http.+?\>', '', plain, re.S)
但它不會讓他們所有,例如,這一次沒有得到刪除:
<http://ax.phobos.apple.com.edgesuite.net/email/images_shared/spacer_99999\r\n9.gif>
如果在分配第二個字符串之前加上r(原始字符串)('r'')或者把雙反斜槓(\\\)('')它會工作 –
ton1c
這很奇怪。用了一下它,它確實匹配了它:'re.match(r'。','\ n',re.S)'起作用,但是're.sub(r'。','','' \ n',re.S)'不。所以它似乎相匹配,但替換部分以某種方式失敗......真的不知道在哪裏或如何。就好像re.S不適用於're.sub'。 –
是的,這是發生在我身上的事情。部分網址已被刪除,但其他網址仍保留。 – 8vius