2012-12-27 154 views
2

我想從網頁源找到絕對路徑鏈接。
例如,在網頁源,有這樣一行:從網頁源獲取絕對路徑

href="lectures/lecture04.pdf" 

但是這方面的絕對路徑是

www.abc.com/courses/cs101/lectures/lecture04.pdf 

有沒有辦法讓bash shell的這條道路?

+1

你知道你正試圖解析的網頁的網址嗎? – anishsane

回答

4

嘗試:

$ wget --convert-links URL 

wget manual,開關--convert-links描述如下:

到尚未被Wget的下載文件的鏈接將被更改爲包括主機名和它們指向的位置的絕對路徑。

示例:如果下載的文件/foo/doc.html鏈接到/bar/img.gif(或鏈接到../bar/img.gif),那麼doc.html中的鏈接將被修改爲指向http://hostname/bar/img.gif