我有一個數據庫表,它包含以下一列數據格式。在php中解析HTML表格
<table cellspacing="1" cellpadding="0" border="0" width="395">
<tbody>
<tr>
<td valign="top" width="135">
<p>Calories (kcal)<br>Energy (kj)<br>Fats<br>Carbohydrates<br>Protein<br></p>
</td>
<td valign="top">
<p>178<br>748<br>0 g<br>9.6 g<br>0.1 g<br></p>
</td>
<td valign="top" width="135">
<p>Fiber<br>Sugars<br>Cholesterol<br>Sodium<br>Alcohol<br></p>
</td>
<td valign="top">
<p>0 g<br>-<br>0 mg<br>-<br>26.2 g<br></p>
</td>
</tr>
</tbody>
</table>
我要讓這對於Calories
,Fats
,Carbohydrates
和Protein
單獨的列另一個數據庫。 要分離這些數據,我需要從舊數據庫中提取數據並像這樣解析它。
$qry = "SELECT * FROM table";
$res = $mysqli->query($qry);
// new dom object
$dom = new DOMDocument();
while ($row = $res->fetch_assoc()) {
$html = @$dom->loadHTML($row['columndata']);
//the table by its tag name
$tables = $dom->getElementsByTagName('table');
$rows = $tables->item(0)->getElementsByTagName('tr');
foreach ($rows as $row)
{
$cols = $row->getElementsByTagName('td');
echo $cols->item(0)->nodeValue.'<br />';
echo $cols->item(1)->nodeValue.'<br />';
}
}
此輸出以下:
Calories (kcal)Energy (kj)FatsCarbohydratesProtein
1787480 g9.6 g0.1 g
我無法單獨輸出字符串中有新的數據庫中正確列值。
例如,我想有值178
在Calories
列,在Fats
列0 g
等
你是什麼意思「解析基於HTML標籤的數據」? – Preetam 2013-04-30 08:31:04
你想要什麼輸出? – Waygood 2013-04-30 08:32:31
'nodeValue'刪除所有的標籤,你想要的東西像Javascript的'innerHTML'。 DOMDocument API沒有這個,你需要編寫它。在http://php.net/manual/en/class.domelement.php – Barmar 2013-04-30 08:36:51