我正在製作一個python URL抓取程序。對於我而言,我希望它真的快超時,所以我超時正確的,因爲它應該做urllib2超時但不關閉套接字連接
urllib2.urlopen("http://.../", timeout=2)
當然。但是,它不打擾關閉到服務器的連接,所以服務器認爲客戶端仍然連接。如何讓urllib2在超時後關閉連接?
運行gc.collect()不起作用,如果我無法幫助,我不想使用httplib。
我能得到的最接近的是:第一次嘗試會超時。服務器報告連接關閉只是作爲第二次嘗試超時。然後,服務器報告連接關閉只是作爲第三次嘗試超時。無限廣告。
非常感謝。
嗯!一個非常有趣的想法。謝謝,但它不工作;不過,我從來沒有這樣想過。 我認爲對於我的項目來說,我的整個推理只是有點太過分。對我而言,最好不要依賴於此,而只是終止服務器上的重複連接。 – Michael 2010-01-26 06:19:21