我想從這個page上的「箱子得分」按鈕上刮下鏈接。該按鈕應該是這個樣子從頁面上的按鈕上刮下鏈接
http://www.espn.com/nfl/boxscore?gameId=400874795
我試圖用這個代碼,看看我是否能訪問按鈕,但我不能。
from bs4 import BeautifulSoup
import requests
url = 'http://www.espn.com/nfl/scoreboard/_/year/2016/seasontype/1/week/2'
advanced = url
r = requests.get(advanced)
data = r.text
soup = BeautifulSoup(data,"html.parser")
for link in soup.find_all('a'):
print link
1)下載並檢查頁面的原始HTML; 2)找到你想要刮的元素; 3)編寫Python代碼搜索這些元素; 4)??? 5)利潤! – ForceBru
這裏的問題在於,您從網址獲取的html實際上並不是您在瀏覽器中查看時看到的頁面。有很多Ajax調用來填充頁面,所以當您發出初始請求時,該數據還沒有存在 – wpercy