這是我到目前爲止的代碼:如何使用Python在表格中獲取特定信息?
import urllib
import urllib.request
from bs4 import BeautifulSoup
def make_soup(url):
page = urllib.request.urlopen(url)
soupdata = BeautifulSoup(page, "html.parser")
return soupdata
soup = make_soup('http://www.lassen.co.nz/pickandgo.php?fyear=q&teama=SAF#hrh')
table = soup.find_all('table')[1]
for record in table.find_all('tr'):
for data in record.find_all('td'):
print(data.text)
目前它打印表的內容,通過所有列循環。我怎樣才能做到這一點,所以它可以專門抓取某一列和某一行?舉例來說,如果我想要它抓取第1列&第5列(目前的數據是41-23),它怎麼可能?我可以讓它打印出確切的數據嗎?謝謝。
here is the webpage
那麼,是什麼的'[1]'做'在soup.find_all( '表')結束[1]' –
的[1]指搶頁面上的第二個表。 (因爲頁面上有多個表) –
so ...那麼,在行和單元格上使用該索引有什麼問題? –