2014-02-24 46 views
1

我使用scrapy 0.20與Python 2.7運行相同的蜘蛛同時放

我要問,什麼是運行相同的蜘蛛的缺點和優點兩次在同一時間?

請知道我正在使用管道將結果寫入json文件。

感謝

+0

多個蜘蛛爬取相同的域或不同的域? – Talvalin

+0

@Talvalin同一個蜘蛛,同一個域名 –

回答

0

唯一的應用程序,我看到在蜘蛛的同時多個實例在運行時每個實例都將有它的start_urls自己的一部分。但是每個實例應該在不同的網絡接口上運行,否則無法有效控制相同域的爬網強度。