2011-12-22 53 views

回答

0

經過更多的研究,我認爲提供機器人規則的預期方式是通過繼承WWW :: RobotRules。

{ 
    package WWW::NoRules; 
    use vars qw(@ISA); 
    use WWW::RobotRules; 
    @ISA = qw(WWW::RobotRules::InCore); 

    sub allowed { 
     return 1; 
    } 
} 

my $ua = LWP::RobotUA->new(agent=>'my-robot/0.1', from=>'[email protected]', rules=>WWW::NoRules->new); 
1

LWP :: RobotUA是LWP :: UserAgent,支持添加了robots.txt。如果你不想要求robots.txt,那麼就使用LWP :: UserAgent。

或者,子類LWP :: RobotUA並覆蓋simple_request方法並去除robots.txt和規則處理。