2014-09-29 78 views
0

正在測試基於Web的應用程序。基於網絡的應用程序定期引入新按鈕,新選項卡等。使用Perl從HTML頁面提取信息

這將是很好建立一個自動化的工具,讀取HTML頁面,並從中提取信息,我想到的是:

  • 哪些按鈕有
  • 將在哪裏按一個按鈕使我
  • 哪些選項卡是有
  • 和等

請問如果任何人有使用Perl FO什麼經驗類似的任務?

感謝

回答

3

如果你想要做的網頁瀏覽任何自動化模擬,WWW::Mechanize應該是你的第一個停靠港。從大綱的WWW ::機械化:

WWW::Mechanize或機甲的簡稱,是一個Perl模塊編程狀態網頁瀏覽,用於與網站的交互自動化。

特點包括:

  • 所有的HTTP方法
  • 高級超鏈接和HTML格式的支持,而不必解析 HTML自己
  • SSL支持
  • 自動餅乾
  • 定義HTTP標頭
  • 自動處理重定向
  • 代理
  • HTTP認證

有一整套的處理方法鏈接 - e.g。 follow_linkfind_link - 用於查找輸入 - 例如。 find_all_inputs - 你可以模擬填表和其他典型的瀏覽活動。

還有一些模塊用於DOM解析和操作 - 例如, Mojo::DOMXML::LibXML

總之,應該有足夠的perl模塊來做你想做的事情,所以編寫你自己的框架將不是必需的。