我用WWW :: Selenium模塊編寫了一個簡單的perl腳本,該模塊與Selenium RC服務器交互並進入網頁並下載源代碼。我可以用HTML頁面做到這一點。但是,我有一個XML頁面,我想下載它的源代碼。 'get_source_html()'函數顯然不可行。下面是我想做的腳本:Selenium RC Perl腳本如何獲取xml頁面的源代碼?
#!/usr/bin/perl -sw
use WWW::Selenium;
print "\n setting up Selenium...\n";
my $sel = WWW::Selenium->new(host => "localhost",
port => 4444,
browser => "*firefox",
browser_url => "http://www.google.com",
);
print " starting Selenium...\n";
$sel->start;
$sel->open('someXMLpage...');
$sel->wait_for_page_to_load();
my $xml = $sel->get_html_source();
print $xml;
正如你可以看到get_html_source顯然是一個問題,因爲它會返回一個錯誤,指出該頁面是不是HTML。有什麼方法可以下載瀏覽器中顯示的當前頁面,而不管頁面的類型如何(比如點擊'view source'在firefox中,甚至更好:一些get_source()函數)?另外請注意,我需要使用的網址並不以'.xml'文件結尾。該頁面是即時生成的,如果這意味着什麼...
任何智慧大大感謝!
是的,get_page_source()解決了我的問題! :) – CODEBLACK