2016-04-09 208 views
0

我使用URL lib2,我需要幫助。 當我從網站上獲得我需要的信息時,它可以正常工作,但如果網站上的信息發生變化,結果仍然相同,我認爲我必須找到一種清理「緩存」或「 lib.close「...我不知道...有人可以幫我解決這個問題嗎?謝謝需要解決方案urllib2

下面是代碼:

import urllib2    

url = 'http://website.com' 

response = urllib2.urlopen(url) 
webContent = response.read() 

string = webContent.find('***') 
alert = webContent[string+11:] 

webContent = alert 
string = webContent.find('***') 
alert = webContent[:string] 
alert = alert.replace('</strong>',' ') 

print alert 

回答

0

的urllib2沒有做緩存。涉及HTTP代理或緩存發生在服務器端。

檢查響應標題。 X-CacheX-Cache-Lookup將意味着您通過代理連接。

+0

謝謝你的回答, 我看着X-Cache和X-Cache-lookup,我可以爲我找到解決方案... 如果我更改網站上的信息並在我的電腦瀏覽器上刷新它,它立即更新... 您可以與我分享的更多信息? –

+0

你可以在你的問題中添加更多關於你的項目的信息/代碼嗎?這是你的網站主持人,對吧?你使用什麼技術堆棧?這[用戶](http://stackoverflow.com/a/10008270/6079540)必須欺騙他的useragent ...順便說一句,你可以通過使用rgx來簡化你的代碼:'import re; alert = re.findall(r'\ * {3}(。+)\ * {3}',webContent)[0]' – dron22