3
我想從html文件中提取所有表格,並按以下方式打印其各個單元格,每個單元格由\t
分隔,每行用\n
分隔,每個表格用\n\n
。以下是我的腳本,當我將它改爲在tr上查找值時,整個tr作爲一個元素插入,我甚至嘗試了其他方法,如findnodes_as_strings($ path),我想將其修改爲上述結構。使用Html :: TreeBuilder :: XPath打印表格內容
use strict;
use warnings;
use HTML::TreeBuilder::XPath;
my $tree= HTML::TreeBuilder::XPath->new;
$tree->parse_file("html.html");
my @values=$tree->findvalues(q{//table//tr//td});
print $_, "\n" foreach(@values);
有沒有原因您不使用[HTML :: TableExtract](http://blog.nu42.com/2012/04/htmltableextract-is-beautiful.html)? –