需要解決方案urllib2

我使用URL lib2，我需要幫助。當我從網站上獲得我需要的信息時，它可以正常工作，但如果網站上的信息發生變化，結果仍然相同，我認爲我必須找到一種清理「緩存」或「 lib.close「...我不知道...有人可以幫我解決這個問題嗎？謝謝需要解決方案urllib2

下面是代碼：

import urllib2    

url = 'http://website.com' 

response = urllib2.urlopen(url) 
webContent = response.read() 

string = webContent.find('***') 
alert = webContent[string+11:] 

webContent = alert 
string = webContent.find('***') 
alert = webContent[:string] 
alert = alert.replace('</strong>',' ') 

print alert

來源

2016-04-09 Thiago Neves

的urllib2沒有做緩存。涉及HTTP代理或緩存發生在服務器端。

檢查響應標題。 X-Cache或X-Cache-Lookup將意味着您通過代理連接。

來源

2016-04-09 13:50:32 dron22

謝謝你的回答，我看着X-Cache和X-Cache-lookup，我可以爲我找到解決方案... 如果我更改網站上的信息並在我的電腦瀏覽器上刷新它，它立即更新... 您可以與我分享的更多信息？ –

你可以在你的問題中添加更多關於你的項目的信息/代碼嗎？這是你的網站主持人，對吧？你使用什麼技術堆棧？這[用戶]（http://stackoverflow.com/a/10008270/6079540）必須欺騙他的useragent ...順便說一句，你可以通過使用rgx來簡化你的代碼：'import re; alert = re.findall（r'\ * {3}（。+）\ * {3}'，webContent）[0]' – dron22

需要解決方案urllib2

回答

相關問題