2
我想從website中提取某些鏈接。Python - 從網站中提取特定鏈接
提取所有環節,我想:
import urllib
import xml.etree.ElementTree as ET
from BeautifulSoup import *
url = 'http://pdok.bundestag.de/index.php?qsafe=&aload=off&q=kleine+anfrage&x=0&y=0&df=22.10.2013&dt=13.01.2016'
uh = urllib.urlopen(url)
data = uh.read()
soup=BeautifulSoup(data)
soup.prettify()
for href in soup.findAll('a'):
print href
現在,我得到的鏈接列表,但由於某些原因,我沒有得到在tbody
的重要環節。我也試過使用ElementTree,但是我剛剛閱讀鏈接時發生錯誤,因爲它使用了一些無效的符號(?)。任何幫助深表感謝! :)
啊好吧,這是有道理的。我會研究一下,謝謝! :) – erocoar