我有一個像Python中的google.com
這樣的字符串,我想分成兩部分:google
和.com
。問題是我有一個網址,如subdomain.google.com
,我想分成subdomain.google
和.com
。Python的URL拆分
如何將URL的其餘部分與TLD分開?由於TLD(例如.co.uk
)的原因,它無法根據URL中的最後.
進行操作。請注意,該網址不包含http://或www。
我有一個像Python中的google.com
這樣的字符串,我想分成兩部分:google
和.com
。問題是我有一個網址,如subdomain.google.com
,我想分成subdomain.google
和.com
。Python的URL拆分
如何將URL的其餘部分與TLD分開?由於TLD(例如.co.uk
)的原因,它無法根據URL中的最後.
進行操作。請注意,該網址不包含http://或www。
tldextract看起來像你所需要的。它涉及.co.uk
問題。
爲此,您需要一個有效的域名列表。頂級域名(.com,.org等)和國家代碼(.us,.fr等)很容易找到。嘗試http://www.icann.org/en/resources/registries/tlds。
對於二級域名(.co.uk,.org.au),您可能需要查看每個國家/地區代碼以查看其子域。維基百科是你的朋友。
一旦你有了名單,從你有的名字(google.com或co.uk)抓取最後兩部分,看看它是否在你的第二級列表。如果不是,抓住最後一部分,看看它是否在你的頂級列表中。
對於即將推出的新gTLD,這正成爲一個更有趣的問題。不久,我們也將分離'search.google'。 –