我剛剛開始使用Perl,並寫了一個簡單的腳本來做一些網頁抓取。我使用WWW :: Mechanize和HTML :: TreeBuilder來完成大部分工作,但我遇到了一些麻煩。我有以下的HTML:如何根據類提取HTML元素?
<table class="winsTable">
<thead>...</thead>
<tbody>
<tr>
<td class = "wins">15</td>
</tr>
</tbody>
</table>
我知道有一些模塊,從表中獲取數據,但這是一個特例;不是我想要的所有數據都在表格中。所以,我想:
my $tree = HTML::TreeBuilder->new_from_url($url);
my @data = $tree->find('td class = "wins"');
但@data
返回空。我知道這個方法可以在沒有類名的情況下工作,因爲我已經用$tree->find('strong')
成功解析了數據。那麼,是否有一個模塊可以處理這種類型的HTML語法?我通過HTML :: TreeBuilder文檔掃描,並沒有發現任何似乎,但我可能是錯的。
哇哦,工作平凡。謝謝! – aquemini