我正在寫一些代碼來加載和解析來自Web的HTML文檔。爲什麼我不能用JDOM加載這個URL?瀏覽器欺騙?
我用JDOM像這樣:
SAXBuilder parser = new SAXBuilder();
Document document = (Document)parser.build("http://www.google.com");
Element rootNode = document.getRootElement();
/* and so on ...*/
它正常工作,這樣。但是,當我將URL更改爲其他網站時,例如「http://www.kijiji.com」,則parser.build(...)
行會掛起。
任何想法爲什麼它掛起?我是wondernig,如果它可能是因爲kijiji知道我不是一個「真正的」網絡瀏覽器 - 也許我必須欺騙我的http請求,所以它看起來像它來自IE或類似的東西?
任何想法很有用,謝謝!
Rob
處理文檔類型的方法是創建常用的永久本地緩存。 –