2012-08-09 192 views
0

我有一個html文件,如下圖所示:Jsoup,如何獲得屬性

<a href="http://...123"><img src="http://...jpg?" border="0"/></a> 

    <a href="http://...456"> 
       . 
       . 
       . 

我想HREF鏈接和IMG SRC到HashMap的屬性,

但一些(不是全部) <a href="">標籤不符合<img src="">標籤,

所以我應該如何獲得屬性href鏈接和img src的哈希映射到哈希映射?

如果href鏈接沒有img src,則放棄該行。

回答

0

你想要標籤後面沒有標籤嗎?或其他? 如果它的另一種方式,你可以試試這個 把xpath的東西像String path =「// a [@href]/img」,另一個像「// a [@href]」。 存儲href標記值併爲子節點存儲下一個分析結果,如果它包含img標記,則將其解析並存儲爲鍵值對。

+0

是的,我想存儲鏈接和圖像到一個HashMap, 所以如果標籤沒有圖像資源,就放棄它。 這個概念就像'for(int i = 0; i user1531240 2012-08-09 03:55:13

+0

以及我沒有做在Jsoup的HTML解析,但使用HTML清潔,並通過檢查標籤是否有內部標籤說,例如,如果它有,我們只是向用戶顯示值。 – 2012-08-09 08:33:10