2012-08-14 64 views
2

我目前使用的wget命令相當複雜,但其實質是-p-k標誌來下載所有先決條件。如何將主下載的文件重命名爲index.html?將使用wget下載的網頁的目錄索引重命名爲index.html

例如,我下載一個網頁

http://myawesomewebsite.com/something/derp.html 

這將,例如下載:

  1. derp.html
  2. style.css
  3. firstimage.png
  4. secondimage.jpg

而且甚至一個iFrame:

  1. iframe.html
  2. iframe-style.css

所以,現在的問題是,我該如何重新命名derp.htmlindex.html,毫無意外地重命名iframe.htmlindex.html爲好,因爲我不知道解析下載文件的名稱可能是什麼?

當我在URL爲http://something.tumblr.com/34324/post的Tumblr頁面上嘗試此方法時,它下載爲page.html

我試過了--output-document的標誌,但是結果沒有任何東西被下載。

謝謝!

回答

0

這是我落得這樣做:

如果沒有index.html發現下載後,我用Ruby來獲取URL的derp.html部分,然後搜索derp.html,然後將其重命名爲index.html

它沒有我想要的那樣優雅,但它的工作原理。