2012-10-26 51 views
0

我使用的是Ubuntu,並有一個known URL,我需要下載/保存爲CSV。該URL基於一個參數,並經常更改項目,所以我想寫一個腳本來完成下載,這樣我就不必每次都手動保存它。使用wget獲得csv

我正在嘗試使用wget獲取文件,但網站將內容顯示爲CSV,而文件本身是HTML。如何將頁面的內容保存爲純csv?

wget -O my.csv [url] 

任何人都可以幫忙嗎?

回答

1

似乎該文件中唯一的HTML在每行的末尾是<br />。要刪除它,你可以只是

wget -O- "$URL" | sed 's#<br />$##' > my.csv 
+0

如果你看到在鉻或任何瀏覽器的來源,那麼你是對的。我在wget命令後獲得的文件是一個完整的html :) – rgamber

+0

@rgamber:我用wget測試了發佈的代碼。 – choroba

+0

我想知道爲什麼我得到一個奇怪的輸出與相同的代碼then..With你的代碼我得到一個0字節的文件。我可以知道您使用的是哪種操作系統? – rgamber