2012-05-01 74 views
0

我是新的htmlunit,幾乎沒有編程知識。 在Centos - Web服務器(用於www.mydomain.com)中,我試圖創建代理。設置代理與htmlunit

我希望我的服務器可以作爲代理服務器,用於請求www.mydomain.com和 將響應發送爲htmlsnapshot。

我看到的一些東西像

的SocketAddress地址=新的InetSocketAddress( 「xxx.xxx.xx.xxx」,8888); Proxy proxy = new Proxy(Proxy.Type.HTTP,addr); //或Proxy.Type.SOCKS URL url = new URL(「http://mydomain.com/test」); URConnection conn = url.openConnection(proxy);

但我不知道在哪裏設置。 這可以完全從Apache .. 我沒有看到任何這樣的配置文件爲htmlunit。

BTW,我已經安裝的HtmlUnit(使用JPackage上回購)

+0

你的問題沒有多大意義。 HtmlUnit是一個網頁瀏覽器。它不能用於安裝代理服務器。 –

+0

好的,如果我錯了?我明白了。 Html單元只是一個無頭瀏覽器,它可以虛擬打開網站,獲取內容,就好像網頁已加載並返回網址。 – tike

+0

這是一個無頭瀏覽器,它完全按照FireFox的要求連接到一個網站,並且從Firefox提供的網址下載該網頁,就像Firefox一樣。它不會「虛擬」或「如同加載頁面」一樣做任何事情。它加載頁面。 –

回答

0

是的HtmlUnit無圖形界面的瀏覽器的Java程序,你在哪裏看到您已包含的代碼。從內存中,我甚至無法回想起API,即使有代理類。您可以通過傳遞ProxyConfig將WebClient指向代理,這只是爲了消除WebClient類。

您是否在尋找代理服務器或者模擬瀏覽器的方式?

+0

我想創建原始網站的HTML快照。在某種意義上,請求來到原來的網站,我會通過HTML快照.. 這是理想的爬行器,SEO的目的。 – tike

+0

那麼你想要一隻蜘蛛呢?如果你想留在Java路徑上,請試試像[JSpider](http://j-spider.sourceforge.net/)。 – user1367351

+0

我的目標是爲Developers.google說要可以使用HtmlUnit:\t 如果在JavaScript中創造了很多你的內容,你可能要等一具無頭瀏覽器創建HTML快照考慮使用的技術。例如,使用HtmlUnit。 – tike