2014-01-06 49 views
0

我正在使用無限瀏覽器htmlunits來檢索網頁的web內容,並且代碼對於除「http://www.xyzzzzzzz.com.sg/」之外的其他網站都正常工作。誰能解釋爲什麼會發生這種情況?我已經使用HtmlUnit webdriver作爲BrowserVersion的所有三種瀏覽器CHROME,FIREFOX和IE,沒有任何工作。無法通過htmlunit爲其他網址的特定網址下載web內容其正確

public class Test{ 

    public static void main(String[] args) throws Exception { 

     String url = "http://www.xyzzzzzzz.com.sg/"; 

     WebClient webClient = new WebClient(BrowserVersion.CHROME); 
     webClient.getOptions().setCssEnabled(false); 
     webClient.getOptions().setThrowExceptionOnFailingStatusCode(false); 
     webClient.getOptions().setThrowExceptionOnScriptError(false); 
     webClient.getCookieManager().setCookiesEnabled(true); 
     webClient.getOptions().setUseInsecureSSL(true); 

     HtmlPage currentPage = (HtmlPage) webClient.getPage(url); 
     String content = currentPage.asXml(); 
     webClient.waitForBackgroundJavaScript(20000); 

     System.out.println(content); // NOT SHOWING PROPER CONTECT 
    } 
} 
+0

我研究了很多,並嘗試了很多可用的選項。使用HtmlClient它會拋出416錯誤,但瀏覽器的工作正常,這就是爲什麼我使用HtmlUnit。請建議一些解決方案 – Shashank

回答

0

出租車你請描述什麼是你的意思是不顯示正確的CONTECT.Because我dnt認爲在代碼中有一些錯誤。 有些時候JS會讓HtmlUnit執行問題,所以通過停止它來檢查。

+0

plz將xyzzzzzz替換爲代碼中提及的URL中的jobstreet,然後您會發現SOP正在打印的內容與其網站上提供的內容不同。 – Shashank