2

我想用代理將java中的頁面源代碼拉出來。較高的網頁源代碼提供者

我已經使用httpclient,httpunit和HttpURLConnection,所有這一切都需要5秒,當我去尋找沒有代理的頁面源代碼,但我使用代理,然後它採取12-15秒的單頁。

有什麼辦法提高速度或提供快速頁面源的其他類。

+0

如果它的工作速度夠快而沒有代理,爲什麼你需要一個? – AbdullahC 2011-04-21 10:38:46

回答

1

您需要確定問題的首先位置:您從中拉出網頁的服務器真的很慢,還是您使用的代理服務器真的很慢(或兩者都有)? 如果您在命令行中使用wget(或者甚至可能是curl)類似的東西,它應該向您顯示有關頁面下載時間的統計信息 - 通過代理和繞過代理。如果這些時間與您的代碼顯示的時間相同,那麼您無法優化。但是,如果您看到差異,則可以使用其他方式在代碼中拉出頁面。 作爲一個一般的經驗法則:

如果你正在處理大量的連接
  • 使用普通的Java IO,如果你正在處理大量轉移到只有主機/服務器
  • 屈指可數的
    • 採用Java NIO