1
這是我需要從中提取數據的HTML表格的一個示例。該表是 但卻難免重複使用< TR>,<日>和< TD>BeautifulSoup HTML提取表格數據;循環<tr><th>
<table class="tablename">
<tr>
<th> Animal </th>
<td> Dog </td>
</tr>
<tr>
<th> Fish </th>
<td> Salmon </td>
</tr>
<tr>
<th> Colour </th>
<td> Red </td>
</tr>
</table>
我的代碼是這樣的:
soup = bs4.BeautifulSoup(readHtml, 'html.parser')
tableClassResults = soup.find("table", { "class" : "tablename" })
tr = tableClassResults.find('tr')
th = tr.find('th')
print "th = ", th
td = tr.find('td')
print "td = ", td
這是第一個< TR>做工精細,給th =動物和td =狗。我的問題是,我想遍歷所有的< tr>,並提取< td>和相應的< td>。我發現了一些類似的問題,但我無法弄清楚如何執行findNext和loop部分。