2013-05-16 73 views
0

我需要從鏈接下載一些TIF文件:http://ntsg.umt.edu/project/mod17#data-product以「#」符號的文件路徑處理

我保存路徑和文件名,在wget的目錄下的文本文件,但該數據未得到正確下載。我相信文件路徑中的'#'符號是問題所在。

例如在文本文件(temp.txt)中保留:http://ntsg.umt.edu/project/mod17#data-product/MOD17A2_GPP.2008.M02.tif,然後發出命令:wget -i temp.txt未正確下載所需的文件。請幫我解決這個問題。我將反斜槓符號設爲'#',但它也不起作用。

當我瀏覽文件夾時,上述web鏈接不會改變,保存所需tif文件的子文件夾可通過以下路徑訪問。 /pub/MODIS/NTSG_Products/MOD17/GeoTIFF/Monthly_MOD17A2/GeoTIFF_0.05degree/

回答

1

的「#」確實帶來了一些有趣的問題,一個人必須要小心用反斜槓,或周圍」引用它.. 。' 要麼 」...」。讓我們看看發生了什麼。另一個問題是,「#...」語法在URL中是特殊的,並且不是Web服務器上基礎文件名的一部分。

wget -nd -np -nH 'http://ntsg.umt.edu/project/mod17#data-product/MOD17A2_GPP.2008.M02.tif' -O temp.txt 

temp.txt文件存在,但沒有具體的基本路徑,所以幾乎所有的URL要嘗試使用太天真命令打本地文件系統 - 我們需要用​​

wget -nd -np -nH --base=http://ntsg.umt.edu/project/mod17 --force-html --input-file temp.txt 

這下載了原始mod17文檔引用的文件,但幾乎肯定不是你真正想要的。

從您的問題看來,您似乎在尋找在「數據產品」部分中找到的單個文件,並且需要通過複製位置欄來獲取URL,而不是通過右鍵單擊(例如在Firefox中),然後使用「複製鏈接位置」。粘貼結果的地方應該給你你需要提供給wget的字符串。使用相同的方法,您可以右鍵單擊「上級目錄」鏈接來獲取它們的位置,然後使用wget的遞歸獲取功能來獲取它們中的內容。

祝你好運。

+0

你是對的,複製鏈接位置服務我的目的。必須說,你有很好的技能來應用這個領域的基本概念。謝謝。 – Munish