我有一個包含鏈接的字符串。鏈接通常有以下形式:如何從URL中刪除片段標識符?
http://www.address.com/something#something
有Python中的功能,可以從鏈接中刪除「#something」?
我有一個包含鏈接的字符串。鏈接通常有以下形式:如何從URL中刪除片段標識符?
http://www.address.com/something#something
有Python中的功能,可以從鏈接中刪除「#something」?
只需使用split()
>>> foo = "http://www.address.com/something#something"
>>> foo = foo.split('#')[0]
>>> foo
'http://www.address.com/something'
>>>
試試這個:
>>> s="http://www.address.com/something#something"
>>> s1=s.split("#")[0]
>>> s1
'http://www.address.com/something'
>>> urlparse.urldefrag("http://www.address.com/something#something")
('http://www.address.com/something', 'something')
在Python 3中,urldefrag
功能現在是urllib.parse
部分:
from urllib.parse import urldefrag
unfragmented = urldefrag("http://www.address.com/something#something")
('http://www.address.com/something', 'something')
您可以分配掉不需要的部分,像這樣
fixed, throwaway = urldefrag(url)
其中URL是支離破碎的地址。這比拆分好一點。我沒有檢查它是否更快或更有效。