嗨如何使用python將文章的網址轉換爲打印網址。用Python切片url
文章的URL:http://www.indianexpress.com/news/second-time-as-farce/800228/0
打印網址:HTTP://www.indianexpress.com/story-print/800228/
如何將文章url轉換爲打印url?
嗨如何使用python將文章的網址轉換爲打印網址。用Python切片url
文章的URL:http://www.indianexpress.com/news/second-time-as-farce/800228/0
打印網址:HTTP://www.indianexpress.com/story-print/800228/
如何將文章url轉換爲打印url?
使用urllib.parse.urlparse()
從URL的其餘部分雕刻路徑,posixpath.split()
和posixpath.join()
改革路徑,urllib.parse.urlunparse()
再次把它全部重新走到一起。
from urllib.parse import urlparse
def transform(url):
parsed = urlparse(url)
return '{0}://{1}/story-print/{2}/'.format(parsed.scheme, parsed.netloc, parsed.path.split('/')[-2])
一定要檢查標籤。 – 2011-06-16 05:04:51
被誤解。我更新了導入。 – Jordan 2011-06-16 05:09:05
出於好奇,是否需要posixpath? urlparse總是會返回一個正斜槓。 – Jordan 2011-06-16 05:05:09
你不想使用'os.path',因爲在Windows上會給你'ntpath'。 – 2011-06-16 05:05:58
在這種情況下硬編碼正斜槓是否有問題? – Jordan 2011-06-16 05:07:32