2013-08-28 21 views
0

我想從目錄中下載1000個文件:wget的從不同的子域的特定文件夾到原始鏈接

http://downloads.domain.com/myfiles

不過,我沒有權限直接訪問該文件夾。

取而代之,網頁http://www.domain.com/myfiles/index.html包含指向另外100個頁面的鏈接。這些頁面中的每一個都鏈接到我想下載的10個文件(在第一個文件夾中構成1000個文件)。

因爲我想要的文件存儲在頁面的不同子域中,我似乎必須設置跨越主機,否則wget將不會獲取文件。不幸的是,頁面還包含一些我不想要的文件鏈接,以及大量鏈接到互聯網其他部分的鏈接,因此跨越主機爲我提供了大量來自各地的隨機文件。

如何告訴wget只是從第一個目錄中獲取文件?

+0

老問題,我知道,但是當我搜索到類似的東西時,它首先出現在谷歌上。這個答案可能很有用:http://superuser.com/a/487206 – Terrabits

回答

0

你不能限制它只是第一個目錄,但可以將其限制爲特定的域:

wget -rH -Dserver.com http://www.server.com/ 

更多細節here

相關問題