比方說,我有一個分配有10個IP的squid代理服務器(本地在我的gigE網絡上)。使用代理服務器與本地主要IP
而且我們也可以說我有一個分配給它一個不同的IP地址10,運行的是運行10個線程C#應用程序在不同的服務器,使用每個線程抓取網站。每個線程使用不同的分配IP來發送其HTTP請求。
我的問題是,如果我在該應用程序中運行10個線程,其中每個線程使用來自代理服務器的代理IP來抓取網站。而且我還在該應用中嘗試了10個線程,其中每個線程直接在服務器上使用本地分配的IP來爬網。哪種方法可以更快地抓取站點之間的網頁,使用代理IP的線程,還是使用自己的服務器使用直接IP的線程?
我會想象服務器上的直接IP,因爲代理服務器有固有的延遲,但它證明代理服務器速度稍快。所以我很困惑。也許是因爲使用直接IP使用一些處理能力,通過使用代理服務器,它可以將該處理外包給代理服務器?非常感謝幫助。
我們需要看到你的爬行代碼 –