2011-05-20 135 views
3

是否有任何現有的框架可以下載完整的網頁(不是網站):一個HTML頁面,它的樣式表,(javascript)和圖像?下載完整的網頁

如果可能,我想避免解析HTML和樣式表。

回答

2

我知道有HTML Agility Pack - 這肯定會做HTML部分。

您將可以輕鬆地查詢鏈接的圖像,樣式表和JavaScript文件,但它無法處理這些。

請參閱this SO問題的CSS解析。

除了使用JScript之外,我無法想到.NET的任何Javascript解析器。

+0

我結束了使用AgilityPack和一個簡單的正則表達式從CSS中提取圖像。 – jgauffin 2011-05-29 08:12:09

3

有一個wget CLI工具。它有一個完整的網頁的-p選項:

wget -p www.yousite/page.html 
+0

我在ubuntu測試這個命令,真是太棒了,很有用 – 2012-02-01 23:46:51