2
我想從網頁源找到絕對路徑鏈接。
例如,在網頁源,有這樣一行:從網頁源獲取絕對路徑
href="lectures/lecture04.pdf"
但是這方面的絕對路徑是
www.abc.com/courses/cs101/lectures/lecture04.pdf
有沒有辦法讓bash shell的這條道路?
我想從網頁源找到絕對路徑鏈接。
例如,在網頁源,有這樣一行:從網頁源獲取絕對路徑
href="lectures/lecture04.pdf"
但是這方面的絕對路徑是
www.abc.com/courses/cs101/lectures/lecture04.pdf
有沒有辦法讓bash shell的這條道路?
嘗試:
$ wget --convert-links URL
從wget
manual,開關--convert-links
描述如下:
到尚未被Wget的下載文件的鏈接將被更改爲包括主機名和它們指向的位置的絕對路徑。
示例:如果下載的文件/foo/doc.html鏈接到/bar/img.gif(或鏈接到../bar/img.gif),那麼doc.html中的鏈接將被修改爲指向
http://hostname/bar/img.gif
。
你知道你正試圖解析的網頁的網址嗎? – anishsane