2013-01-06 36 views
-1

我寫了一個腳本來通知我一個網站的變化。我使用wget下載網站html,然後將其與過去下載的網站進行比較。問題是,每隔幾次它檢查站點<!--cached--></html>添加。我試圖添加--no-cache到wget,但這沒什麼區別。爲什麼<!--cached-->被隨機添加到wget輸出中?

爲什麼<!--cached-->被隨機添加到wget輸出中?這是我可以做些什麼來防止這種情況,還是應該重新考慮我檢查網站的方式?

回答

1

Oracle添加了類似於此的標籤來指示可從緩存中提供的動態頁面,以避免重新生成頁面。這可能表示內容與您以前的閱讀沒有變化。你可以把它過濾出來。

相關問題