2012-08-09 137 views
1
我使用Perl作爲本次作業的唯一語言

創建Web蜘蛛/機器人腳本需要幫助在Perl

我的目的:

要創建一個Perl腳本,將創建一個Web蜘蛛/機器人。 我的腳本將從互聯網上下載一個網頁,搜索並提取Metatags, 然後將它們編入MySQL數據庫中。

我的數據庫可以通過元標記字段或通過網頁界面的URL進行搜索。

我的腳本還會顯示完整的數據庫,其中包含一個列出數據庫中記錄數量的特殊字段。

所以我的問題是:

我該如何去有關網絡蜘蛛會從互聯網下載的網頁,並提取元標記創建一個腳本?

我可以閱讀哪些資源來幫助我創建此文件或任何腳本?

謝謝你的時間!

+2

看看WWW :: Mechanize。 – 2012-08-09 21:36:27

+2

如果您使用Perl,您可能會開始查看cpan中的各種HTTP模塊:http://www.cpan.org/modules/index.html。 (你可以在那裏找到Sebastian建議的WWW :: Mechanize) – scrappedcola 2012-08-09 21:37:00

+0

感謝您的建議。我不知道該網站大聲笑 – Umeed 2012-08-09 21:40:09

回答

3

您的教授。假設您將掌握一些關於Perl的知識並使用CPAN模塊。如果你不知道CPAN,那麼開始here。一旦您熟悉如何安裝和使用來自CPAN的模塊,請安裝其中一個模塊,並開始編寫代碼。

「我如何去創建腳本」太籠統了。如果您是Perl新手,請嘗試使用Impatient PerlPerl.org或各種tutorial sites的任何其他資源。

+0

謝謝!我一直在查看這些資料,現在我有點揪心。 LWP :: Simple從字面上看非常簡單。你的答案基本解決了我的問題。謝謝 – Umeed 2012-08-10 00:18:59

+0

很高興有幫助。 :) – Hameed 2012-08-10 00:38:07