我有一個很長的HTML文件,其中包含組織及其URL的名稱。代碼中的每個組織的「部分」都由「組織」一詞加上許多代碼進行劃分,其URL位於該代碼內部,並以「組織」一詞結尾。查找兩個字符串內的URL正則表達式
例如:
組織 - 大量的代碼(用URL位於某處內) - 組織
我曾嘗試使用正則表達式搜索和提取URL,但無濟於事。
organization(?<Protocol>\w+):\/\/(?<Domain>[\[email protected]][\w.:@]+)\/?[\w\.?=%&=\ @/$,]*organization
我懷疑我的問題在於我試圖通過只使用單詞「組織」劃定爲URL的搜索某個地方,但我不知道。
'organization。*?'... r如果你可以讓'.'也匹配換行符,否則它可能是'organization(。| \ s)*?'等等。 – Wrikken
10你可以給我們看一個* actual *的例子?我們可以測試我們的解決方案嗎? – ghoti