如何刪除'http'或'https'和'www',然後在給出'http://www.google.com'時遺留在'google.com'?如何刪除infront正則表達式?
no_http_URL = regexp(domain_URL,'[a-z]+://','match','once')
上面的代碼返回結果的'http',這與我的答案相反。
如何刪除'http'或'https'和'www',然後在給出'http://www.google.com'時遺留在'google.com'?如何刪除infront正則表達式?
no_http_URL = regexp(domain_URL,'[a-z]+://','match','once')
上面的代碼返回結果的'http',這與我的答案相反。
no_http_URL = regexp('http://google.com', 'https?://(?:www\.)?(.*)','tokens','once')
no_http_URL = regexp('http://www.google.com', 'https?://(?:www\.)?(.*)','tokens','once')
no_http_URL = regexp('https://google.com', 'https?://(?:www\.)?(.*)','tokens','once')
no_http_URL = regexp('https://www.google.com','https?://(?:www\.)?(.*)','tokens','once')
在no_http_URL
上面的表達式是1x1 cell array
。如果您需要訪問字符串值,您需要執行以下操作:
no_http_URL = no_http_URL{1,1}
難道你不能只刪除網址的前7個字符,如果它以http://開頭?
編輯:你不能找到網址中的第一個點,並刪除它之前的一切嗎?我的意思是,把一個子字符串放在點之後的字符中。
我有一千個URL,每個URL都有不同的字符,我想檢測'。'它位於'www'後面,只留下左側的域名。我必須用編碼來做,而不是手動。 – user3340270
所以這是我的問題在這裏 – user3340270
那麼,你不需要正則表達式來做到這一點。 – Valdrinit
我可以這樣做已經'no_http_URL = regexp(data,'(?<= ''''匹配','一次')'返回我'google.com',但如果我的其他數據有'https'或'www',它會將我留空。我想要它也返回''後面的URL。 – user3340270
我有一千個網址,每個網址都有不同的字符,我想檢測'。'。它位於'www'後面,只留下左側的域名。 – user3340270
@ user3340270你爲什麼不嘗試執行上面的表達式,看看它們是如何工作的?正如你可以注意到的,它們都使用相同的正則表達式。 –