2011-07-27 127 views
0

我需要幫助解決以下問題:網頁抓取搜索結果

我需要驗證通過谷歌搜索引擎高速緩存的URL爲特定網站。在這種情況下,url將404或者頁面不會呈現一些必要的html元素(被認爲是壞掉的),我需要記錄這些URL,然後301重定向到正確的URL。我知道PHP和一點Python,但我不確定使用什麼方法從給定站點的搜索引擎結果中取消所有URL。

回答