我需要在Python中創建用於在發生更改時監視網站的軟件。目前我有定期任務,並檢查以前版本的網站內容。有沒有更簡單的方法來檢查網站內容是否已更改,可能是最後一次更改的時間,以避免下載內容時間?獲取網站上的最後更改
0
A
回答
4
您可以使用HEAD
HTTP方法,並在實際再次下載完整內容之前查看Date-Modified
和ETag
標題等。
然而,沒有什麼能保證當實體的(URL)內容發生變化時,服務器實際上會更新這些標頭,或者甚至可以正確地響應HEAD
方法。
1
儘管它沒有回答你的問題,但我認爲值得一提的是,你不必存儲以前版本的網站來查找更改。你可以計算它的總和md5
並存儲這個總和,然後計算它的新版本並檢查它們是否相等。
關於這個問題本身,AKX給了一個很好的答案 - 只要找到Date-Modified
標題,但記住它不能保證工作。
相關問題
- 1. Python - 獲取獨特的網站更改
- 2. 獲取EF上下文已更改錯誤後更新站點
- 3. 獲取最後更改日期在SQL
- 4. 獲取網站在iPhone上
- 5. 更改網站上顯示的文字
- 6. 如何在我的網站上獲取最新的推文?
- 7. 在網站上獲取JavaScript重定向的最終目的地
- 8. 訪問DNS更改後的上一個網站
- 9. 獲取網站
- 10. 獲取網站
- 11. 在網站上獲取最新的訪問者
- 12. 如何獲取網站在Twitter上發佈的最新新聞
- 13. 更改網站網址
- 14. 如何獲取c#網頁的最後修改日期?
- 15. Googlebot 404在網站更改後抓取錯誤
- 16. 從外部網站獲取數據,然後修改它
- 17. 更改Joomla網站上的域名,並自動更改鏈接?
- 18. 成功部署後,我無法在網站上進行更改。
- 19. 獲取Java中的AS400 DDS文件的最後更改日期
- 20. 當網站發生更改時,通知在網站上閃爍?
- 21. 獲取用戶名在Joomla網站中更改
- 22. 更改Powershell腳本以將網站從IIS獲取到Azure
- 23. 獲得最後的變化,因爲最後一個值更改
- 24. 用GIT獲取文件的最後更改
- 25. TFS - 獲取最後包含的所有更改集
- 26. 如何獲取django-simple-history中最後更改的對象?
- 27. jQuery:獲取輸入字段的最後更改
- 28. 使用vb.NET獲取xml文件的最後更改日期
- 29. 獲取從網站
- 30. 獲取網站源
謝謝,我現在正在使用散列,但我需要下載內容以提供新的散列來與舊的進行比較,但問題在於內容太長時,我會監視很多網站。 – Damir 2012-03-16 14:03:31