1
你好,我想重用輸出鏈接打開輸出網站的新鏈接。使用RSS Feed我可以實現鏈接。我需要處理所有輸出鏈接。這是可能的代碼?Python打開鏈接到鏈接
import urllib2
import re
htmlfile = urllib2.urlopen('http://www.spiegel.de/schlagzeilen/tops/index.rss')
htmltext = htmlfile.read()
regex = '<guid>(.+?)</guid>'
pattern = re.compile(regex)
links = re.findall(pattern,htmltext)
downloadlinks = ''
for i, link in enumerate(links):
if i == 0:
downloadlinks += link
else:
downloadlinks += ' ' + link
print (downloadlinks)
的輸出是:
http://www.spiegel.de/panorama/leute/jennifer-lopez-singt-beim-geburtstag-von-turkmenistans-praesident-a-908601.html
http://www.spiegel.de/sport/sonst/tony-martin-setzt-tour-de-france-trotz-sturz-fort-a-908600.html
http://www.spiegel.de/politik/ausland/ecuador-schiebt-verantwortung-fuer-snowden-auf-russland-a-908595.html
http://www.spiegel.de/panorama/wetter-temperaturrekorde-im-westen-der-usa-a-908593.html http://www.spiegel.de/politik/deutschland/polizei-raeumt-camp-hungerstreikender-fluechtinge-in-muenchen-a-908592.html
...
的其它實施例:
import urllib2
import re
htmlfile = urllib2.urlopen('http://www.kino.de/rss/neu-im-kino/')
htmltext = htmlfile.read()
regex = '<link>(.+?)</link>'
pattern = re.compile(regex)
links = re.findall(pattern,htmltext)
downloadlinks = ''
for i, link in enumerate(links):
if i == 0:
downloadlinks += link
else:
downloadlinks += ' ' + link
print (downloadlinks)
'-------------------------------------------------------------------------------------- --------------------------'
htmlfile_2 = urllib2.urlopen(downloadlinks)
htmltext_2 = htmlfile_2.read()
regex_2 = '<meta itemprop="contentURL" content="(.+?)" />'
pattern_2 = re.compile(regex_2)
links_2 = re.findall(pattern_2,htmltext_2)
downloadlinks_2 = ''
for i, link in enumerate(links_2):
if i == 0:
downloadlinks_2 += link
else:
downloadlinks_2 += ' ' + link
print (downloadlinks_2)
的輸出是:
http://www.kino.de/kinofilm/the-deep/130585
http://www.kino.de/kinofilm/englisch-fuer-anfaenger/145880
http://www.kino.de/kinofilm/the-grandmaster/147546
http://www.kino.de/kinofilm/jets-helden-der-luefte/148993
http://www.kino.de/kinofilm/laurence-anyways/144027
http://www.kino.de/kinofilm/modest-reception-die-macht-des-geldes/142819
http://www.kino.de/kinofilm/papadopoulos-und-soehne/145922
http://www.kino.de/kinofilm/seitengaenge/132599
http://www.kino.de/kinofilm/a-silent-rockumentary/149048
http://www.kino.de/kinofilm/world-war-z/120130
我想有這樣的:
htmlfile_2 = urllib2.urlopen(http://www.kino.de/kinofilm/the-deep/130585)
比輸出是:
http://flashvideo.kino.de/video/clipfile/627/000551627.mp4
是否要打開正在打印的鏈接? –
是的,但所有的鏈接:) – user2534685
打開它們,然後保存其內容或做什麼與他們? –