0
看來wget
無法獲得asp
文件,而html
沒有問題。我已經寫了一個腳本來wget一些URL並將它們保存爲csv
格式。 腳本是wget無法保存asp頁面
wget -qO- http://www.wunderground.com/weatherstation/WXDailyHistory.asp?ID=KPAPALMY1&format=1 | sed 's+<br />++g' > $1.csv
看來wget
無法獲得asp
文件,而html
沒有問題。我已經寫了一個腳本來wget一些URL並將它們保存爲csv
格式。 腳本是wget無法保存asp頁面
wget -qO- http://www.wunderground.com/weatherstation/WXDailyHistory.asp?ID=KPAPALMY1&format=1 | sed 's+<br />++g' > $1.csv
你必須把引號圍繞該URL!如果沒有加引號,Bash(或者你正在使用的任何shell)會將&
視爲在後臺運行wget
的請求 - 並且&
之後的格式參數不會發送到服務器。試試這個:
wget -qO- 'http://www.wunderground.com/weatherstation/WXDailyHistory.asp?ID=KPAPALMY1&format=1' | sed 's+<br>++g' > $1.csv
請注意,我調整你的sed
命令,太 - <br>
是你正在越來越沒有終止斜線。另外:刪除那些<br>
s意味着只有每個其他行都有數據。希望這不會成爲問題,因爲使用sed
刪除換行符有點痛苦,但如果是這樣,請參閱this question瞭解如何操作。
希望有幫助!
你可以發佈你的整個腳本?另外:'wget'那個網頁對我來說工作得很好。但是服務器返回的頁面不是CSV格式 - 引入了額外的'
'標籤,每行似乎都以不必要的逗號結尾。 –
@ Xavier Holt:張貼編輯 – mahmood