2014-12-20 22 views
1

我正在用python編寫一個程序,它會每天從網站上自動下載pdf文件。 當試圖測試時,我注意到下載的文件有正確的擴展名,但它們非常小(< 1kB),而手動下載的正常大小約爲100kB。網站能否自動下載文件來停止程序?

網站能否阻止程序自動下載文件?

對此有什麼可以做的嗎?

回答

3

是的。 Cloudflare可以阻止漫遊器下載文件。阻止通常通過檢測用戶代理或在網頁中包含JavaScript來完成。我會檢查記事本中的pdf文件,看看它包含的內容也嘗試在你的python代碼中添加一個用戶代理選項。