2015-06-28 44 views
0

短篇小說:如何使Wget名稱文件成爲URL的一部分?

我想Wget的命名下載文件,因爲它們相匹配的正則表達式令牌([^/]*)

wget -r --accept-regex="^.*/([^/]*)/$" $MYURL 

全文:

我使用GNU Wget的遞歸下載一個特定的文件夾在特定的WordPress網站下。我使用正則表達式只接受帖子,沒有別的。下面是我如何使用它:

wget -r --accept-regex="^.*/([^/]*)/$" $MYURL 

它的工作原理和Wget遵循所有所需的URL。但是,它將文件保存爲.../last_directory/index.html,但我希望這些文件保存爲last_directory.html.html部分是可選的)。

有沒有辦法單獨用Wget做到這一點?或者你會建議如何用sed或類似工具做同樣的事情?

回答

1

你可以使用sed。

wget -r --accept-regex="^.*/([^/]*)/$" $MYURL | sed 's~\(.*\)/[^.]*~\1~' 

例子:

$ echo '/foo/last_directory/index.html' | sed 's~\(.*\)/[^.]*~\1~' 
/foo/last_directory.html 
+0

如果我猜中了,那麼你的建議:(1)下載的所有文件,然後(2)遍歷使用bash腳本,並將所有文件(3)申請'sed'命令來重命名每個文件。理想情況下,我想避免下載後遍歷文件。 不幸的是,如果該文件夾有額外的文件,這種方法無法正常工作 - 我只想重新命名新下載的文件。該腳本會將其他文件移動到一個文件夾中。 –

相關問題