0
使用cUrl下載網站時遇到了一些麻煩。像網絡瀏覽器那樣的捲曲下載網站
問題網站:cell。 COM
現在它遵循所有重定向,e.g:
curl -L http://cell. com -o test.html -v
...但是通過cUrl作者創建的文件比我的瀏覽器是能拉什麼完全不同。
希望能夠幫助您瞭解如何使用cUrl重新創建瀏覽器的行爲。
使用cUrl下載網站時遇到了一些麻煩。像網絡瀏覽器那樣的捲曲下載網站
問題網站:cell。 COM
現在它遵循所有重定向,e.g:
curl -L http://cell. com -o test.html -v
...但是通過cUrl作者創建的文件比我的瀏覽器是能拉什麼完全不同。
希望能夠幫助您瞭解如何使用cUrl重新創建瀏覽器的行爲。
我解決了這個問題。
那個有問題的網站使用cookies,然後在那個行爲重定向到另一個有另一個Javascript重定向的頁面。
無論如何,解決方案是使用CookieJar和寫入cookie的一個文件:
curl -L http://cell. com -o test.html -c cookie_filename
希望幫助的人來到這裏的未來。
這應該得到你的目標頁面的html並寫入'test.html'。你取而代之的是什麼? – meatspace
我得到一些腳本標籤的空白頁面,而不是真正的頁面包含。 – soiepark
curl不理解javascript。也許phantomjs會更適合你的需求? – meatspace