-1
輸入html是attached (my $file),使用以下腳本,我無法提取我想要的表。有什麼建議麼?HTML :: TableExtract不起作用
use strict;
use warnings;
use HTML::TableExtract;
my $file="view-source_www.nasdaq.com_dividend-stocks_dividend-calendar.aspx_date=2017-Apr-19.html";
open DATA,$file || die "cannot";
my $content;
{
local $/ = undef; # slurp mode
$content = <DATA>;
}
close DATA;
my $te;
$te = HTML::TableExtract->new(headers => [qw(Announcement_Date)]);
$te-> parse($content);
# Examine all matching tables
foreach my $ts ($te->tables) {
print "Table (", join(',', $ts->coords), "):\n";
foreach my $row ($ts->rows) {
print join(',', @$row), "\n";
}
}
您的文件實際上是一個HTML頁面,其中包含另一個頁面的(轉義)源。您可能需要原始的HTML,而不是它的編碼版本。 – jcaron
[HTML :: TableExtract很美](https://www.nu42.com/2012/04/htmltableextract-is-beautiful.html)...「不起作用」沒有幫助。 –