我使用正則表達式的下列線這是我從this SO answer發現:爲什麼這行正則表達式捕獲空白?
(:[\ W [AZ] - ] +:(?:?/ {1,3} | [A-Z0 -9%])| WWW \ d {0,3} [] | [A-Z0-9 .-] + [??] [AZ] {2,4} /)(:。?[^ \ S ()<>] + |(([^ \ s()<>] + |(([^ \ s()<>] +)))))+(? <>] + |(([^ \ s()<>] +))))| [^ \ s`!()[] {} ;:'「。,<>?«»」「'' ])
我在以下字符串上測試它:
「Quattro Amici將於2014年3月3日舉行音樂會。長期合作者Lun Jiang,小提琴;羅伯塔Zalkind,中提琴; Pegsoon Whang,大提琴;和鋼琴家Karlyn Bond將演奏弗蘭茨約瑟夫海頓,沃爾夫岡阿馬多伊斯莫扎特,路德維希範貝多芬和加布裏埃爾福雷的作品。要購買門票,請訪問westminstercollege.edu/culturalevents或致電801-832-2457。 - 多見於:http://entertainment.sltrib.com/events/view/quattro_amici_in_concert#sthash.QRsLXXiA.dpuf「
我只是試圖提取字符串URL和基於一堆SO答案,我發現正則表達式是該作業的推薦工具,我不一個正則表達式的專家(或者我的理解中的中間),所以我對re.findall()一直返回的空字符串感到困惑,我已經使用正則表達式隊列中的正則表達式行,並且仍然沒有運氣。非常感激
長度超過40-80個字符的正則表達式是[垃圾表達式](http: //blog.codinghorror.com/regular-expressions-now-you-have-two-problems/)(根據我和其他人的說法)。 –