2013-05-01 73 views
0

我試圖下載使用此文件在這裏使用wget文件列表文件列表:http://webdatacommons.org/downloads/2012-08/nquads/files.list使用wget下載使用-i選項

如下所述:http://webdatacommons.org/2012-08/stats/how_to_get_the_data.html#toc0

,但我得到以下信息:

[email protected]:~/RDF$ wget -i files.list
--2013-05-01 11:49:44-- http://webdatacommons.org/downloads/2012-08/nquads/html-mf-geo-00000.nq.sort.gz%0Dhttp://webdatacommons.org/downloads/2012-08/nquads/html-mf-geo-00001.nq.sort.gz%0Dhttp://webdatacommons.org/downloads/2012-08/nquads/html-mf-geo-00002.nq.sort.gz%0Dhttp://webdatacommons.org/downloads/2012-08/nquads/html-mf-geo-00003.nq.sort.gz%0Dhttp://webdatacommons.org/downloads/2012-08/nquads/html-mf-geo-00004.nq.sort.gz%0Dhttp://webdatacommons.org/downloads/2012-08/nquads/html-mf-geo-00005.nq.sort.gz%0Dhttp://webdatacommons.org/downloads/2012-08/nquads/html-mf-geo-00006.nq.sort.gz%0Dhttp://webdatacommons.org/downloads/2012-08/nquads/html-mf-hcalendar-00000.nq.sort.gz 解決webdatacommons.org(webdatacommons.org)... 129.13.253.75 連接到webdatacommons.org (webdatacommons.org)| 129.13.253.75 |:80 ...已連接。發送HTTP請求 ,等待響應... 403 Forbidden 2013-05-01 11:49:44錯誤 403:禁止。

如果我只在該文件中使用單行,它就可以工作。這表明這可能與換行符有關?我在Ubuntu上。有人可以建議爲什麼wget這樣做嗎?

回答

2

您必須替換文件的行尾字符。你可以使用這個命令來做到這一點

sed -e 's/\r/\n/g' files.list > files.list.new 
wget -i files.list.new 
+0

呃,對,所以它只是行分隔符。謝謝! – 2013-05-01 13:47:39