0
HTML有很多不同的解析器,因此很難選擇合適的解析器。用於表格的Perl HTML解析器
我的任務是讀網址並找到<table>
具體ID,然後解析所有<tr>
行此表的內容(文本),也<a>
鏈接和內<td>
標籤<img>
圖像。
我還需要檢查類爲每個行元素將數據分類到類別。
什麼是我最好的選擇,我應該使用哪種庫和哪些方法來快速獲取資料?
的HTML代碼的一部分的例子,我想分析:
<table id="t1">
<tr class="r1">
<td class="c1"><a href="..."><img height="50" src="..." width="50" /></a></td>
<td class="c2">
<div class="d1">
<ul class="u1">
<li class="l1"><a href="..." rel='...'>text here</a></li>
<li class="l2"><a href="..." rel='...'>text here</a></li>
</ul>
</div>
<div class="d2">
<a href="...">text here</a>
</div>
</td>
<td class="c3">
<div ...>...</div>
<div class="d2">
<a href="...">text here</a>
</div>
</td>
<td class="c4">text here</td>
<td class="c5">text here</td>
</tr>
...
</table>
謝謝。我用HTML例子更新了這個問題。 –