我有以下字符串Python的正則表達式刪除號碼和數字與punctaution
line = "1234567 7852853427.111 https://en.wikipedia.org/wiki/Dictionary_(disambiguation)"
我想刪除的號碼1234567個7852853427.111使用常規expresisions
我有這個重新 n第=應用re.sub( 「^ \ d + \ s | \ s \ d + \ s | \ s \ d \ w \ d | \ s \ d + $」,「」,line)
但它沒有做我希望它會做的這樣做。
任何人都可以指向正確的方向嗎?
上*爲什麼*您嘗試沒有工作的一些寬鬆的言論:開始錨似乎是正確的,但那個結束錨不是。到目前爲止,它不是弦的結尾!另外,這些'|'的所有**將整個正則表達式分成不同的部分 - 也就是說,第一部分匹配字符串的開頭,但第二部分不匹配。您可能想了解如何創建帶圓括號的組。 – usr2564301
這個字符串從哪裏來? HTML解析? – alecxe
大多數當前的建議或多或少都會殺死字符串中的每個數字序列。你能否合理地確信,你想保留的部分永遠不會有數字?去掉「前兩個單詞」怎麼樣?或者「http://'」之前的所有內容?您的標題提到*標點符號* - 開頭的「1..2」應該刪除嗎? – usr2564301