我使用urllib3來爬網。示例代碼:Python | HTTP - 如何在下載之前檢查文件大小
from urllib3 import PoolManager
pool = PoolManager()
response = pool.request("GET", url)
的問題是,我可以在URL,它是一個真正的大文件的下載,我不是在下載它interseted絆倒。
我發現這個問題 - Link - 它建議使用urllib
和urlopen
。我不想聯繫服務器兩次。
我想限制文件大小爲25MB。 有沒有辦法可以做到這一點urllib3
?
閱讀直到你點擊25MB,然後取消下載? – jarmod
這是一個選項。我怎樣才能做到這一點? –
您可以使用HTTP HEAD謂詞並讀取Content-Length標題來檢索大小。如果服務器省略了Content-Length,除非像jarmod提到的那樣開始下載文件,否則無法檢查大小。 –