2013-03-20 57 views
3

當netloc是空的urlparse.urlunparse是不一致的:爲什麼urlparse.urlenparse工作不一致?

>>> urlparse.urlunparse(('http','','test_path', None, None, None)) 
'http:///test_path' 
>>> urlparse.urlunparse(('ftp','','test_path', None, None, None)) 
'ftp:///test_path' 
>>> urlparse.urlunparse(('ssh','','test_path', None, None, None)) 
'ssh:test_path' 

它是一個錯誤或功能? 我希望urlunparse始終表現得像第一個例子一樣,即使方案無法識別。

+0

的裏urlparse源代碼缺少'ssh',至少2.6。 – hd1 2013-03-20 02:44:33

回答

2

data元組要傳遞到urlunparse具有以下組件:

scheme, netloc, url, query, fragment = data 

當沒有netloc,而schemeuses_netloc,該網址是

url = scheme + ':' + url 

也就是說urlunparse(它調用urlunsplit)的方式is defined

def urlunsplit(data): 
    ... 
    scheme, netloc, url, query, fragment = data 
    if netloc or (scheme and scheme in uses_netloc and url[:2] != '//'): 
     if url and url[:1] != '/': url = '/' + url 
     url = '//' + (netloc or '') + url 
    if scheme: 
     url = scheme + ':' + url 

注意'ssh'uses_netloc

uses_netloc = ['ftp', 'http', 'gopher', 'nntp', 'telnet', 
       'imap', 'wais', 'file', 'mms', 'https', 'shttp', 
       'snews', 'prospero', 'rtsp', 'rtspu', 'rsync', '', 
       'svn', 'svn+ssh', 'sftp','nfs','git', 'git+ssh'] 

你做,如果你提供一個netloc得到與ssh://開頭的網址:

In [140]: urlparse.urlunparse(('ssh','netloc','test_path', None, None, None)) 
Out[140]: 'ssh://netloc/test_path' 
+0

所以如果我理解正確地改變行爲,我可以使用urlparse.uses_netloc.append('ssh')。那是對的嗎? – 2013-03-20 02:53:57

+0

Eek,no。我沒有達到URL規範。我知道我比urlparse模塊的設計師更少了解規格。所以我不會建議更改'uses_netloc'。 – unutbu 2013-03-20 02:58:20