我正在編寫一個Python代碼,用於處理一段文本,其中的文本對我來說無用,其中包含網址。在文本塊之外,我只需要域,而不是完整的URL。例如輸入:如何僅將URL的域部分與正則表達式匹配?
47.91.158.176 or 54.145.185.110 port 80 - gooolgeremf.top - GET /search.php
47.90.205.113 or 35.187.59.173 port 80 - voperforseanx.top/site/chrome_update.html
所以我在這裏只需要gooolgeremf.top
和voperforseanx.top
匹配,但我寫的正則表達式也將匹配search.php
和chrome_update.html
。
我在想,正則表達式應該在/
之後停止匹配。但是我不知道如何實現它,特別是如何防止整個文本文件中的第一個/
之後出現的匹配域。
它至今工作在我的代碼的方式:
regexdm="[A-Za-z0-9]{1,}\.[A-Za-z0-9]{1,10}\.?[A-Za-z]{1,}\.?[A-Za-z]{1,}"
dmsc=re.findall(regexdm, iocsd.read())
你的意思是FQDN /主機名,還是隻有域名? – mootmoot