我是編程新手,所以很有可能我想做我想做的事完全不是這樣做的。Python刮表
我試圖從這個網站上刮排積分榜 - http://www.flashscore.com/hockey/finland/liiga/ - 現在如果我甚至可以用團隊名稱刮一列,那也沒關係,所以我嘗試找到類爲「participant_name col_participant_name col_name」的td標籤,但代碼返回空括號:
import requests
from bs4 import BeautifulSoup
import lxml
def table(url):
teams = []
source = requests.get(url).content
soup = BeautifulSoup(source, "lxml")
for td in soup.find_all("td"):
team = td.find_all("participant_name col_participant_name col_name")
teams.append(team)
print(teams)
table("http://www.flashscore.com/hockey/finland/liiga/")
我試過用tr標籤來檢索整行,但沒有成功。
我很高興提供幫助!請記住[接受](https://meta.stackexchange.com/a/5235)答案,如果有幫助的話,這對社區是一個總體的好處。 –
真棒 - 謝謝。 我試圖使它現在基於行工作,但行沒有共同的單個類,但每個人都有獨特的類,而不是像這樣: 奇怪的glib-participant-I9wm5xTA, 即使是glib參與者-zV5a4drH 依此類推。有沒有辦法讓下面的代碼在名稱中查找具有特定字符串的類(在這種情況下,它將是「glib-participant」)而不是全名? rows = soup.findAll('tr',{'class':「participant_name col_participant_name col_name」}) –
@SomeGuy我想你可以使用'regex'表達式。 'soup.findAll('tr',{'class':re.compile(「你的正則表達式」)})' –