2016-07-06 61 views
0

使用cUrl下載網站時遇到了一些麻煩。像網絡瀏覽器那樣的捲曲下載網站

問題網站:cell。 COM

現在它遵循所有重定向,e.g:

curl -L http://cell. com -o test.html -v 

...但是通過cUrl作者創建的文件比我的瀏覽器是能拉什麼完全不同。

希望能夠幫助您瞭解如何使用cUrl重新創建瀏覽器的行爲。

+0

這應該得到你的目標頁面的html並寫入'test.html'。你取而代之的是什麼? – meatspace

+0

我得到一些腳本標籤的空白頁面,而不是真正的頁面包含。 – soiepark

+0

curl不理解javascript。也許phantomjs會更適合你的需求? – meatspace

回答

0

我解決了這個問題。

那個有問題的網站使用cookies,然後在那個行爲重定向到另一個有另一個Javascript重定向的頁面。

無論如何,解決方案是使用CookieJar和寫入cookie的一個文件:

curl -L http://cell. com -o test.html -c cookie_filename 

希望幫助的人來到這裏的未來。