如何在Wget或Python中獲取當前版本的網頁?我需要完全關閉緩存。獲取當前版本的網頁
我正試圖編寫代碼,每秒下載http://robocademy.com/courses/arduino/get_code/。使用Python的urllib和Wget我沒有像在Chrome中那樣獲取當前文件。 我試過
wget --cache=off --user-agent="Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1)" http://robocademy.com/courses/arduino/get_code/
和urllib的與urllib.urlcleanup
響應頭在Chrome:在Wget的
Accept-Ranges:bytes
Age:0
Connection:keep-alive
Content-Encoding:gzip
Content-Length:449
Content-Type:text/plain
Date:Wed, 28 Nov 2012 23:20:24 GMT
Server:nginx
Vary:Accept-Encoding
Via:1.1 varnish
X-Varnish:400211059
響應頭
HTTP/1.1 200 OK
Server: nginx
Content-Type: text/plain
Keep-Alive: timeout=20
Vary: Accept-Encoding
Transfer-Encoding: chunked
Date: Wed, 28 Nov 2012 23:22:20 GMT
X-Varnish: 400216320 400212892
Age: 76
Via: 1.1 varnish
Connection: keep-alive
這是什麼問題? – Lior
如何在Wget或Python中獲取當前版本的網頁? –
您*正在*獲取當前版本的網頁,因爲服務器被配置爲提供服務。您是否有特定的原因,您爲什麼要根據管理員的意圖覆蓋服務器的配置? –