2012-01-11 28 views
1

我只是一個初學者,學習並試圖在這一刻實現一堆事物。Perl - 將多個帶有日期的PDF文件下載到文本中

我想從在線PDF文件中獲取文本。

我有一個正在下載一個文件代碼:

#!/usr/bin/perl 
use warnings; 
use strict; 
use POSIX 'strftime'; 
use LWP::Simple; 

my $url = 'http://www.gpo.gov/fdsys/pkg/CREC-2011-01-26/pdf/'; 
my $file = 'CREC-2011-01-26.pdf', localtime; 

getstore("$url/$file", $file); 

我想知道是否有修改日期的方式:說,改變日期2011-01-25在評論並在一年內提取所有文件?

此外,有沒有一種方法可以從聯機源中獲取文本而無需下載文件。我很感激!

回答

-2

Perl有「for循環」。他們將是您嘗試在所有日期下載文件的好方法。你可能會得到兩個嵌套循環,一個爲幾個月,一個爲日期。瞭解更多:

http://perl.about.com/od/perltutorials/a/forloop_2.htm

請不要忘記兌現版權,並引用引用。

+0

謝謝 - 我熟悉for循環,我只是不知道在URLS和PDF格式日期的格式.. – appletree 2012-01-11 07:07:53

+0

這個答案是無益的。如果它是我的,我會羞於將其刪除。 – 2012-01-11 14:24:15

1

要將所有天遍歷在2011年:

use 5.010; 
use DateTime qw(); 

my $counter = DateTime->new(year => 2011, month => 1, day => 1,); 
my $end  = DateTime->new(year => 2012, month => 1, day => 1,); 
while ($counter < $end) { 
    say $counter->ymd(q(-)); 
    # 2011-01-01 
    # 2011-01-02 
    # 2011-01-03 
    # 2011-01-04 
    # ⋮ 
    # 2011-12-28 
    # 2011-12-29 
    # 2011-12-30 
    # 2011-12-31 
    $counter->add(days => 1); 
} 

剛剛得到從在線源中的文本,而無需下載文件

典型self-answered question。該功能是get。請閱讀您正在使用的軟件的文檔。