如果您WWW::Mechanize
& pQuery
#2做搜索,你會使用這些Perl的CPAN模塊看到很多例子。
但是,因爲您提到「非程序員」,那麼或許Web::Scraper
CPAN模塊可能更合適?它更像DSL之類,因此對於「非程序員」來說可能更容易接受。
下面是從文檔從Twitter獲取鳴叫一個例子:
use URI;
use Web::Scraper;
my $tweets = scraper {
process "li.status", "tweets[]" => scraper {
process ".entry-content", body => 'TEXT';
process ".entry-date", when => 'TEXT';
process 'a[rel="bookmark"]', link => '@href';
};
};
my $res = $tweets->scrape(URI->new("http://twitter.com/miyagawa"));
for my $tweet (@{$res->{tweets}}) {
print "$tweet->{body} $tweet->{when} (link: $tweet->{link})\n";
}