回答
它是路由器的公共IP被阻塞。
在這種情況下有兩個網絡。
一,公共互聯網 - 服務器(託管您抓取的網站)連接。
二,您的私人家庭網絡 - Mac連接的位置。
您的路由器充當您的私人家庭網絡到互聯網的網關,從而幫助您的Mac與服務器通話。
要充當「網關」,路由器將有兩個IP地址。一個私人IP地址爲您的家庭網絡和一個公共IP地址。公共IP地址是服務器可見的。在服務器的觀點中,公共IP地址來自抓取請求的來源。
因此它是被阻塞的路由器的公有IP。
也請尊重網站的服務條款並負責任地抓取。
如果你不想得到禁止做嘗試在settings.py以下設置:
它會得到您的互聯網提供商提供的地址,所以您的公共IP。可以檢查這個帖子:Get proxy ip address scrapy using to crawl
有隻有一個看起來像一個IP地址。 http://127.0.0.1:56750/hub/session你知道這是什麼意思嗎? –
好吧,我沒有說明你會在頭文件中找到你的IP ..它仍然是公開IP,如上所述,應該是用於抓取的IP(這樣,如果你被禁止,如果你去,你會沒事的)到隔壁的咖啡館)。您在評論中顯示的地址是您的本地主機與硒中樞,它被用作代理(如果使用代理,則顯示在response.headers中)。所以也許只有你的硒被「禁止」,並且你的路由器的IP地址適合用在這臺服務器上。 – Turo
- 1. scrapy/Python抓取但不抓取數據
- 2. 使用scrapy抓取數據
- 3. 使用Scrapy抓取數據
- 4. 如何抓取yelp.com上的數據而無需阻止我們的IP
- 5. Scrapy:抓取但未抓取
- 6. ajax持續更新php導致服務器阻止我的IP
- 7. .htaccess阻止所有,但我的IP
- 8. 阻止訪問我的Apache服務器
- 9. 我的Kibana服務器的Web抓取
- 10. 使用Scrapy抓取隱藏數據
- 11. 使用scrapy抓取動態數據
- 12. 使用Scrapy抓取網頁數據
- 13. 如何取消阻止託管服務器阻止的IP地址?
- 14. 使用Nginx阻止代理服務器後面的IP
- 15. 如何阻止漫遊器抓取我的基於AJAX的URL?
- 16. 如何阻止我的apache2服務器提供missile_launch_codes.ini服務?
- 17. 運行Flask Web服務器是否會阻止Node.JS中的網頁抓取?
- 18. 設置代理隱藏我的IP地址使用scrapy抓取網頁
- 19. Scrapy抓取但不會刮
- 20. 我們如何檢查我們的IP是否被使用APNS服務的蘋果阻止了
- 21. 如何使用PHP獲取我的服務器的外部IP?
- 22. 使用服務器處理數據的屏幕抓取
- 23. 阻擋多個IP訪問我的服務器在EC2
- 24. Scrapy抓取301重定向頁面,但不抓取他們的數據
- 25. 我的網站服務器的IP地址,而不是域IP
- 26. 提取href scrapy - 抓取但不提取
- 27. AWS紅移會阻止我的IP
- 28. 即使我將它設置爲非阻塞,fopen也會阻止wordpress。這是我的服務器故障嗎?
- 29. 阻止IP重定向到我的阻止頁面
- 30. 爲什麼Google抓取我的robots.txt阻止的網頁?
實際上,我是通過我的學校網絡抓取數據的,所以你的意思是服務器禁止我學校路由器下的所有IP地址?那是對的嗎?? –
假設你的學校只有一個網關和一個公共地址,是的。你學校的每個人都可能被禁止。但學校通常有許多網關和IP地址。 – raghulmz