2016-08-02 24 views
1

我想編寫一個npm包以本地化html網址。
1.使用html url下載html頁面
2.解析html文件,提取html和本地這些資源中使用的所有js,css和img文件。
3.如果這些js,css和img文件使用一些外部資源,則將這些資源本地化。例如,在CSS中提取背景圖像。收集html文件中使用的所有js css和img資源

第一個和第二個要求很容易滿足。但我不知道最後一個。 我可以解析所有的css文件並本地化其中使用的資源。但我如何解析js文件?
例如: 如果js在html dom中添加了'script src = XXX'標記,那麼我如何提取src?

回答

0

我想我會嘗試使用無頭瀏覽器來捕捉每一個網絡調用,而不是試圖解析代碼。

我沒有親自使用它,但PhantomJS似乎符合法案。

它可以用來加載網頁,然後執行通常會發生在請求上的任何腳本/ css,並在頁面加載後執行其他東西。

network monitoring features可能是你想要使用的。

+0

如果我沒有解析文件,我可以將原始文件外部資源的網址更改爲新的本地資源的網址嗎?例如,

相關問題