1
我在設備上具有單個診斷網頁,圖表是由xsl和gif文件組成的XML格式的圖表。有沒有辦法用Python下載整個頁面並將其保存爲單個.mht文件而不是單獨的文件?Python將XML網頁保存爲.mht
我在設備上具有單個診斷網頁,圖表是由xsl和gif文件組成的XML格式的圖表。有沒有辦法用Python下載整個頁面並將其保存爲單個.mht文件而不是單獨的文件?Python將XML網頁保存爲.mht
這本質上是這兩個問題的組合:
據我所知,你可以用urllib下載頁面,用Beautiful Soup解析HTML ,在解析的HTML中找到圖像和其他依賴項,下載它們,重寫t他將解析後的html中的url指向本地副本(Beautiful Soup可以做到這一點),將修改後的HTML保存回磁盤,並使用MHTifier來生成MHT。
也許Scrapy也可以幫助你。