基本上,我有一個應用程序刮。 它每分鐘刮n件物品。 目前我只有一個IP。刮多個IP,在java
我正在抓取的網站允許我爲每個IP 3個連接。
我在考慮獲得另一個IP。
所以我將能夠獲得6個連接。
理論上我應該可以在40秒內或多或少地獲得n個物品。
目前我使用java(commons-httpcore)來完成工作。
我不確定這是java問題還是操作系統問題。
我的機器有IP 1和IP 2 我該如何連接到使用IP 1和使用IP2的www.microsoft.com, ? 我怎麼能指定,我想用來做連接的IP?
是否想過你,他們限制每個IP,因爲他們不想讓你做這樣的事情的連接數? – RHSeeger 2010-03-15 14:05:51
這是否因爲這是關於網頁抓取而被低估? (這不完全合法?) – 2010-03-15 14:05:54
RHSeeger說什麼。 – 2010-03-15 14:11:33