所以我使用python來做一些網頁解析,我想將完整的網址分成兩部分。說我有地址http://www.stackoverflow.com/questions/ask。我需要協議和域名(例如http://www.stackoverflow.com)和路徑(例如/ questions/ask)。我想這可能是通過一些正則表達式來解決的,但我並不那麼方便。有什麼建議麼?如何拆分網址
Q
如何拆分網址
2
A
回答
0
import re
url = "http://stackoverflow.com/questions/ask"
protocol, domain = re.match(r"(http://[^/]*)(.*)", url).groups()
7
使用Python模塊裏urlparse:
https://docs.python.org/library/urlparse.html
對於這樣一個明確的和見多識廣的問題,不編寫自己的代碼麻煩,更何況自己的正表達式。他們造成太多麻煩;-)。
12
丹是正確的:是裏urlparse您的朋友:
>>> from urlparse import urlparse
>>>
>>> parts = urlparse("http://www.stackoverflow.com/questions/ask")
>>> parts.scheme + "://" + parts.netloc
'http://www.stackoverflow.com'
>>> parts.path
'/questions/ask'
+0
得愛電池包括哲學。我認爲最初的b/c正則表達式我不知道電池是否包含在內。謝謝。 – 2008-11-13 18:22:03
相關問題
- 1. 如何在SQL Server拆分網址
- 2. PathHierarchyTokenizerFactory不拆分網址
- 3. 拆分JavaScript網址的jQuery
- 4. 拆分地址
- 5. 拆分網址標籤在JavaScript
- 6. JavaScript網址拆分爲表單手動輸入網址
- 7. 清漆拆分網址和更改網址
- 8. 拆分地址列
- 9. 拆分地址 - TSQL
- 10. 如何分割網址?
- 11. 如何正確拆分網站?
- 12. 地址拆分公式
- 13. 拆分逗號分隔的地址
- 14. 如何區分音頻網址和視頻網址?
- 15. 拆分地址 - 使用拆分()導致奇怪的5位
- 16. 如何拆分web.config?
- 17. 如何拆分值
- 18. 如何拆分ObservableCollection
- 19. perl:如何拆分?
- 20. 如何拆分UIView
- 21. 如何拆分列?
- 22. 如何拆分BitArray
- 23. 如何拆分UIBarButtonItem?
- 24. 如何拆分主分支?
- 25. 分號網址
- 26. 如何在asp.net分裂URL和替換我如何通過asp.net拆分網址「哈希」
- 27. 驗證網址,然後將其拆分成URL和域名
- 28. .htaccess - 如何刪除部分網址?
- 29. 如何查找網址的一部分
- 30. 如何用.htaccess重寫部分網址?
重複。請參閱http://stackoverflow.com/questions/258746/slicing-url-with-python和http://stackoverflow.com/questions/163009/urllib2-file-name – 2008-11-13 10:57:44