2010-10-04 81 views
0

我試圖使用HtmlUnit來獲取網頁的DOM。然而,當我嘗試(使用Eclipse插件)來運行應用程序引擎開發服務器上驗證碼:HtmlUnit的應用引擎支持

WebClient wc=new WebClient(); 
HtmlPage page1= wc.getPage("http://ww.google.com/"); 

我得到這個異常:

java.net.URLStreamHandler is a restricted class. 

是沒可能到可以使用HtmlUnit,在App Engine上?

+0

[Ajax在Google App Engine上抓取 - HtmlUnit是否有效?](http://stackoverflow.com/questions/3285181/ajax-crawling-on-google-app-engine-does-htmlunit-work) – 2010-10-04 12:49:48

回答

1

不,HtmlUnit目前無法在應用引擎沙盒中工作。

但是,HtmlUnit在GAE上工作的補丁正在進行中。 HtmlUnit的bug跟蹤器issue 2962074討論瞭如何使HtmlUnit在GAE上工作,併爲完成此操作提供了一個初步補丁。

+0

我有這個......但我無法理解如何應用該補丁......他們已經提交.diff文件 – 2010-10-05 09:01:11

+0

以使用它們。任何指導方針???? – 2010-10-05 09:01:26

+0

閱讀*打字錯誤:) – 2010-10-05 09:02:07

0

我的印象是HtmlUnit 2.8應該可以工作。

你使用什麼版本?

+0

即時通訊使用HtmlUnit 2.8,但仍然即時通訊面臨同樣的問題。 我無法理解Sourceforge解決方案。並請在msn上添加我。我的ID是[email protected] – 2010-10-05 09:03:33

+0

請將您最小的應用程序發佈到htmlunit用戶列表,其他人可以幫助 – 2010-10-07 19:09:31