可能重複:
How do I grab a thumbnail screenshot of many websites?機械化打印到PDF
我用perl機械化登錄並獲取一個網頁寫了一個腳本。如何直接從我的Perl腳本「打印」該頁面爲「pdf」?我想保存它在瀏覽器中的外觀快照。
我可以用$mech->content();
可能重複:
How do I grab a thumbnail screenshot of many websites?機械化打印到PDF
我用perl機械化登錄並獲取一個網頁寫了一個腳本。如何直接從我的Perl腳本「打印」該頁面爲「pdf」?我想保存它在瀏覽器中的外觀快照。
我可以用$mech->content();
檢出wkhtmltopdf - 有PDF和圖像(PNG等)的變種。它基本上是一個包裝webkit html引擎的命令行工具。工作得非常好,而且它也是跨平臺的。您是否可以通過登錄表單獲取它將取決於目標網站的工作方式。
的$mech
包含普通的HTML得到的HTML,所以你不能只是打印出來。檢查此線程:How do I grab a thumbnail screenshot of many websites?
這輸出PNG,而不是PDF。 – daxim 2012-01-27 10:44:21
有一些CPAN modules to convert HTML to PDF。將其中任何一個來自Mechanize的內容。
請參閱我的回答[有關爲文本中的每個單詞創建圖像的建議](http://stackoverflow.com/a/7820994/46395)。 PDF輸出支持,它將是一個*真實* PDF與可選文本和東西,而不僅僅是一個巨大的嵌入式位圖截圖。這個模塊還沒有一個機械化兼容的前端,但編寫一個不會太困難,因爲[之前的版本有一個](http://p3rl.org/Gtk2::WebKit::Mechanize )。 – daxim 2012-01-27 10:50:33