我有一個table
,其列數可以改變,取決於報廢頁面的配置(我無法控制它)。我只想從列標題指定的特定列中獲取信息。如何在使用DOM抓取網頁表時獲取特定的?
樣品表:
<table>
<tr>
<td>Name</td>
<td>Age</td>
<td>Marks</td>
</tr>
<tr>
<td>A</td>
<td>20</td>
<td>90</td>
</tr>
<tr>
<td>B</td>
<td>21</td>
<td>80</td>
</tr>
<tr>
<td>C</td>
<td>22</td>
<td>70</td>
</tr>
</table>
我工作的PHP代碼來顯示所有列:
foreach($html->find("table#table2 tr td") as $td) {
$code = $td;
echo $code;
}
所需的代碼格式:
foreach($html->find('table#table2 td') as $td) {
/* Get td1 data */
/* Code1 to store td data 1 */
/* Get next td data */
/* Code2 to store td data 2 */
/* Get the next td data */
/* Code3 to store td data 3 */
}
我想提取輸出和存儲它到具有表名的數據庫表導致適當的列。
我可以自己寫存儲代碼。 我需要一個代碼來檢索行內沒有循環的連續td數據。因爲存儲td數據的代碼有所不同。
我參考的帖子 - scraping webpage。
是你使用SimpleHTMLDom解析器? –
@AmalMurali - S.我使用Sourceforge的Simple HTML DOM解析器。 –