0
我有如下表:提取HTML表格用Perl
<table cellpadding="4" cellspacing="0" border="0">
<tr>
<td>
<span class="label">Label1< /pan>
</td>
<td>
label1_value1
</td>
</tr>
<tr>
<td>
<span class="label">Label2</span>
</td>
<td>
Label2_value1 <br/>
Label2_value2 <br/>
</td>
</tr>
<tr valign="top">
<td>
<span class="label">Label3</span>
</td>
<td>
Result 1<br/>
Result 2<br/>
<span class="related"> -
Result 1 SP2<br/> </span>
</td>
<\tr>
</table>
我想使用HTML :: TableExtract爲了提取該表
我用下面的代碼,以提取表:
$te->parse($table_content);
foreach my $row ($te->rows) {
if (defined($row->[1])) {
$row->[1]=~s/^\s+//gm;
$row->[1]=~s/\s+$/;/gm;
print $row->[1],"\n";
}
}
我想在這個格式結果:
label1_value1,label1_value1;label1_value2,result1;result2-result3
,但我得到錯誤的結果可能會有人幫什麼我的代碼,或者如果它possilbe問題解析與HTML跨度:: TableExtract
我得到如下: label1_value1 Label2_value1 Label2_value2;
RESULT1
RESULT2
-
reuslt1;
**你得到了什麼**結果? – duskwuff
您應該修復表格的第四行:' Label1 < /pan>'最後應該有''。 –