2012-05-12 33 views
4

如果我使用wget,並從URL獲取html文件。如何從該HTML文件生成HAR文件。如何從HTML文件生成HAR文件?

  1. 任何用於從html文件生成har文件的開源實現?
  2. HAR文件生成後,我可以使用harlib從HAR文件讀取數據。

如果可能請提出C,C++或Java實現。

回答

5

HAR格式的主要觀點是擁有許多工具可以使用和分析的標準HTTP跟蹤格式。換句話說,對於性能分析而言,它的主要目的並不是「歸檔」網頁本身。

如果您使用wget獲取頁面,則缺少所有性能數據的99%。要捕獲必要的數據,您確實需要瀏覽器執行請求,獲取所有相關資源,保存所有定時器等。這將使您能夠構建瀑布圖等。

如果需要捕獲數據在服務器上,那麼你可以使用pcap來捕獲TCP跟蹤,然後convert that to HAR,儘管你仍然需要一個客戶端,它實際上會解析HTML並請求所有的子資源(pcap只是在後臺偵聽)。或者,你可以路由你的瀏覽器through a proxy,讓它爲你吐出一個HAR文件。

最後但並非最不重要的是,您可以通過其調試接口驅動瀏覽器並以此方式導出HAR文件。用於驅動Firefox的Java示例:https://github.com/Filirom1/browsermob-page-perf