我正嘗試從Java中的http://www.amazon.com/gp/bestsellers/electronics提取org.w3c.dom.NodeList
。下面是我用來顯示在谷歌瀏覽器的JavaScript控制檯後,我的結果XPath語句:使用Java和XPath提取網頁內容
$x("//div[@class='zg_itemRightDiv_normal']")
上面的語句工作得十分完美,但是當我使用Java的javax.xml.xpath
和org.w3c.dom
庫,我沒有得到任何結果:
XPathExpression expr = xPath.compile("//div[@class='zg_itemRightDiv_normal']");
NodeList productNodes = (NodeList) expr.evaluate(doc, XPathConstants.NODESET);
// In the above productNodes definition, doc is a org.w3c.dom.DocumentFragment
System.out.println(productNodes.getLength()); // prints out '0'
我錯過了什麼?
嘗試給出完整路徑.... – mtk