2
我創建了一個Wget的抓取工具供個人使用。如何使用尾部斜線在網站上進行填充,並保存就像沒有結束的斜線
wget -k -m -Dwww.website.com -r -q -R gif,png,jpg,jpeg,GIF,PNG,JPG,JPEG,js,rss,xml,feed,.tar.gz,.zip,rar,.rar,.php,.txt -t 1 http://www.website.com/ &
在網站上的職位例如URL是http://www.website.com/post-one/
,其中每一個崗位已經在網址的結尾斜線。
保存時的Wget將創建:
www.website.net/post-one
www.website.net/post-one/index.html
第一行是文件夾,而第二行是實際的HTML文件,我在尋找。問題是,Wget會爲每個帖子創建一個文件夾,這使得數據更難處理。
我想Wget創建www.website.net/post-one
其中post-one
這是HTML文件,而不是爲每個帖子創建文件夾。
我試過很多方法,沒有運氣。使用-R .html
沒有內容的結果文件夾。