2015-05-25 30 views
1

假設我想保存我的Facebook頁面的內容。很明顯,fb使用https,因此ssl,我如何使用wget下載安全頁面的內容?如何通過wget或curl訪問https頁面?

我在網上發現了很多資源......並且修改了我的命令,但它並沒有保存我想要的頁面。

wget --secure-protocol=auto "https://www.facebook.com/USERNAMEHERE" -O index.html 

其實這是我得到index.html中的結果: 「更新瀏覽器 您使用的是不是Facebook支持的Web瀏覽器 爲了獲得更好的體驗,去到其中一個網站並獲取您的首選瀏覽器的最新版本:「

+0

http://linuxfreelancer.com/modifying-user-agent-in-curl-or-wget – Amadan

回答

5

問題不在於SSL/https。問題在於,facebook將「wget」視爲代理並告知「更新瀏覽器」。

你必須使用--user-agent開關來欺騙Facebook並模仿現代瀏覽器。

wget --user-agent="Mozilla/5.0 (Windows NT 5.2; rv:2.0.1) Gecko/20100101 Firefox/4.0.1" https://facebook.com/USERNAME -O index.html 

然後你會看到實際的Facebook頁面,如果你在現代瀏覽器中打開index.html。

+0

「'--secure-protocol = protocol'」標誌的用途是什麼? – carrots

+0

如手冊頁所述,使用--secure-protocol可以指定要使用的協議(如tls1,tls2,ssl,..)。給它「自動」讓wget自己選擇協議,但你也可以手動指定你想要的。 – Jadi