1
我正在寫一個使用Perl從Web抓取器獲取http://www.coupons.com/ 中的數據問題是我用LWP :: UserAgent獲取的HTML與我在Web瀏覽器中看到的不同。我對JavaScript變量「CouponClubMember」的內容感興趣,並且在用Perl收到的HTML中,這個變量是空的。爲什麼用Perl讀取的HTML看起來與我在瀏覽器中看到的不一樣?
任何想法?
我正在寫一個使用Perl從Web抓取器獲取http://www.coupons.com/ 中的數據問題是我用LWP :: UserAgent獲取的HTML與我在Web瀏覽器中看到的不同。我對JavaScript變量「CouponClubMember」的內容感興趣,並且在用Perl收到的HTML中,這個變量是空的。爲什麼用Perl讀取的HTML看起來與我在瀏覽器中看到的不一樣?
任何想法?
使用下面的代碼,我得到了與我的瀏覽器相同的東西。我只設置agent
到相同的字符串我的Firefox發送並啓用cookie處理:
use LWP::UserAgent;
my $ua = LWP::UserAgent->new(
agent => 'Mozilla/5.0 (Windows NT 5.1; rv:7.0.1) Gecko/20100101 Firefox/7.0.1',
cookie_jar => {},
);
$res = $ua->get("http://www.coupons.com");
if($res->content =~ /(CouponClubMember.{300})/) {
print $1;
}
您可能需要設置'用戶agent'。 – 2011-12-23 04:28:53