如何拆分網址

2008-11-13 68 views 2 likes

所以我使用python來做一些網頁解析，我想將完整的網址分成兩部分。說我有地址http://www.stackoverflow.com/questions/ask。我需要協議和域名（例如http://www.stackoverflow.com）和路徑（例如/ questions/ask）。我想這可能是通過一些正則表達式來解決的，但我並不那麼方便。有什麼建議麼？如何拆分網址

來源

2008-11-13 The.Anti.9

重複。請參閱http://stackoverflow.com/questions/258746/slicing-url-with-python和http://stackoverflow.com/questions/163009/urllib2-file-name – 2008-11-13 10:57:44

回答

import re 
url = "http://stackoverflow.com/questions/ask" 
protocol, domain = re.match(r"(http://[^/]*)(.*)", url).groups()

來源

2008-11-13 03:12:46 Cybis

使用Python模塊裏urlparse：

https://docs.python.org/library/urlparse.html

對於這樣一個明確的和見多識廣的問題，不編寫自己的代碼麻煩，更何況自己的正表達式。他們造成太多麻煩;-)。

來源

2008-11-13 03:13:00

丹是正確的：是裏urlparse您的朋友：

>>> from urlparse import urlparse 
>>> 
>>> parts = urlparse("http://www.stackoverflow.com/questions/ask") 
>>> parts.scheme + "://" + parts.netloc 
'http://www.stackoverflow.com' 
>>> parts.path 
'/questions/ask'

來源

2008-11-13 03:37:48

得愛電池包括哲學。我認爲最初的b/c正則表達式我不知道電池是否包含在內。謝謝。 – 2008-11-13 18:22:03

相關問題

11. 如何正確拆分網站？
12. 地址拆分公式
13. 拆分逗號分隔的地址
14. 如何區分音頻網址和視頻網址？
15. 拆分地址 - 使用拆分（）導致奇怪的5位
16. 如何拆分web.config？
17. 如何拆分值
18. 如何拆分ObservableCollection
19. perl：如何拆分？
20. 如何拆分UIView
21. 如何拆分列？
22. 如何拆分BitArray
23. 如何拆分UIBarButtonItem？
24. 如何拆分主分支？
25. 分號網址
26. 如何在asp.net分裂URL和替換我如何通過asp.net拆分網址「哈希」
27. 驗證網址，然後將其拆分成URL和域名
28. .htaccess - 如何刪除部分網址？
29. 如何查找網址的一部分
30. 如何用.htaccess重寫部分網址？