0
我想反映使用下列URL格式的網站:鏡像與wget的網站基於特定的查詢字符串
http://example.com/homepage?page=1
我想僅鏡像使用從頁面查詢字符串的那些= 1到page = 100。我如何通過wget儘可能提高效率?
我不需要遞歸鏡像,只有第1到100頁。保存CSS/JS也很好。排除圖像可以很好地保持速度(只對文字感興趣)。
幫助?
我想反映使用下列URL格式的網站:鏡像與wget的網站基於特定的查詢字符串
http://example.com/homepage?page=1
我想僅鏡像使用從頁面查詢字符串的那些= 1到page = 100。我如何通過wget儘可能提高效率?
我不需要遞歸鏡像,只有第1到100頁。保存CSS/JS也很好。排除圖像可以很好地保持速度(只對文字感興趣)。
幫助?
創建的URL列表:
seq 1 100 | xargs -n 1 -I {} echo http://example.com/homepage?page={} > URLS.txt
然後用wget的下載所有:
wget -i URLS.txt