我有一個蜘蛛類,在用戶請求蜘蛛網站的內容。每個搜索結果都會加載大約30個網站,搜索這些信息並將其標準化。Java:HtmlUnit效率關係PHP CURL?
我已經使用CURL在PHP中編寫了它,因爲PHP缺少多任務我想切換到Java(我知道多進程捲曲不適合我的需求)。我需要一個可以POST/GET的HTTP客戶端,接收和設置cookie以及修改HTTP頭。
我發現HtmlUnit看起來很漂亮,但也超出了我的需求,而且由於軟件包相對較大,一分鐘我會有很多的尋線請求,我不想過度使用解決方案來減慢我的服務器速度。
你認爲這會是一個問題,你有其他建議來取代Java中的CURL嗎?我應該使用Java CURL綁定嗎? 這是一個問題效率和服務器負載。
我已經測試的效率: 4)的Java/6,2的HtmlUnit秒 3)的Java/Apache_HTTPClient 5,3秒 2)PHP/CURL 4,92 Secods 1)的Java/Jsoup 1,8秒 – 2011-06-04 21:39:31