我試圖找到一種方法來取文本塊,用其他文本替換該文本中的所有網址,然後返回新文本大塊和它找到的URL列表。喜歡的東西:查找並替換一段文本中的URL,返回文本+ URLS列表
text = """This is some text www.google.com blah blah http://www.imgur.com/12345.jpg lol"""
text, urls = FindURLs(text, "{{URL}}")
應該給:
text = "This is some text {{URL}} blah blah {{URL}} lol"
urls = ["www.google.com", "http://www.imgur.com/12345.jpg"]
我知道這會涉及到一些正則表達式 - 我發現了一些看似不錯的URL檢測正則表達式在這裏: http://www.regexguru.com/2008/11/detecting-urls-in-a-block-of-text/
我敢垃圾與正則表達式,但是,我發現,讓它做我想要的python相當棘手。 URL返回的順序並不重要。
謝謝:)
你能試試我提供的更新正則表達式嗎? – obsoleter
downvoted因爲這個問題已被放棄 – obsoleter