我試圖在Perl中使用LWP :: Simple從聯合國網站(安理會決議等)下載一些PDF文檔。然而,我沒有返回PDF,而是收到一個HTML錯誤頁面。考慮這個非常簡單的例子:無法使用Perl和LWP下載PDF
use LWP::Simple;
use strict;
my $url = 'https://documents-dds-ny.un.org/doc/UNDOC/GEN/N16/100/02/PDF/N1610002.pdf';
my $file = 'test.pdf';
getstore($url, $file);
如果我再看看「檢驗.pdf」的內容,我覺得他們是一個HTML頁面。
我也試過一些LWP :: UserAgent技巧,甚至用cURL,但沒有成功。有任何想法嗎?
如果您試圖直接使用瀏覽器訪問此鏈接,您也會收到錯誤消息。因此,有一些身份驗證,cookie,引用或鏈接所需的任何內容。 –
瀏覽器有點碰巧和缺失:大多數時候,當我將路徑粘貼到瀏覽器中時,PDF加載正確。有時它會給出HTML錯誤頁面,但在大多數情況下不會。 – spatiallyConfused
「*大多數時候,當我粘貼到瀏覽器的路徑,PDF加載正確*」,然後,大部分時間,你以前訪問過的主要網站。下載網站預計由主站點設置Cookie。 – ikegami