2014-02-22 132 views

回答

2

我會使用超過裏urlparse爲BeautifulSoup提取URL的碎片。這裏有一個例子:

from urlparse import urlparse 

parsedurl = urlparse('http://example.com/filename.txt') 
print parsedurl.path 

輸出將是:

/filename.txt

3

如果您的基名是您的意思,給出http://example.com/file.txt您想要file.txt?在那種情況下,你根本不需要美麗的湯。簡單的字符串操作代碼將工作。

這也是knownos.path.basename('http://example.com/file.txt)會給你file.txt