0
我的目標是從鏈接中獲取特定標籤的數量,我想要抓取的。我手動檢查了標籤的數量,我的代碼找不到所有的標籤。BeautifulSoup找不到所有標籤
我試過不同的解析器,如「html.parser」,「html5lib」和「lxml」,但每次都會發生錯誤。
我的代碼:
from bs4 import BeautifulSoup
from selenium import webdriver
urls = ["http://www.basket.fi/sarjat/ottelu/?game_id=3502579&season_id=93783&league_id=4#mbt:2-400$t&0=1",
"http://www.basket.fi/sarjat/ottelu/?game_id=3502523&season_id=93783&league_id=4#mbt:2-400$t&0=1",
"http://www.basket.fi/sarjat/ottelu/?game_id=3502491&season_id=93783&league_id=4#mbt:2-400$t&0=1",
"http://www.basket.fi/sarjat/ottelu/?game_id=3502451&season_id=93783&league_id=4#mbt:2-400$t&0=1",
"http://www.basket.fi/sarjat/ottelu/?game_id=3502395&season_id=93783&league_id=4#mbt:2-400$t&0=1",
"http://www.basket.fi/sarjat/ottelu/?game_id=3502407&season_id=93783&league_id=4#mbt:2-400$t&0=1"]
for url in urls:
browser = webdriver.PhantomJS()
browser.get(url)
table = BeautifulSoup(browser.page_source, 'lxml')
print(len(table.find_all("tr", {"class":["row1","row2"]})))
輸出:
88
87
86
66
86
59
目標輸出:
88
86
87
87
86
83
你能告訴我們你到底要湊什麼? – mostaszewski