我對網絡抓取很陌生。我想從here那裏獲取數據,主要是有關國家的年份,國家和國內生產總值的權利數據。如何使用Python從本網站刮取所有數據
我的代碼如下:
from urllib.request import urlopen
from bs4 import BeautifulSoup
data = "http://databank.worldbank.org/data/reports.aspx?source=2&series=NY.GDP.MKTP.CD&country=#"
page = urlopen(data)
soup = BeautifulSoup(page,'html.parser')
name_box = soup.find('div',attrs = {'class':'canvas'})
name = name_box.text.strip()
print(name)
我可以得到的數據卻是隻有那些在頂部10+。
所以我的問題是,當數據不在頁面本身(即從別處導入)時,如何解決這些問題。 預先感謝您的任何意見。
搜索JavaScript呈現,使用Chrome開發人員工具檢查請求,或使用硒 – eLRuLL
(1)您嘗試打開的URL中有空白。 (2)你試圖接收哪些數據? –
感謝您指出這一點,這是網站:http://databank.worldbank.org/data/reports.aspx?source=2&series=NY.GDP.MKTP.CD&country=#否則你可以點擊'這裏'在題。 – learnandshare