我收到來自第三方的其他服務的iFrame鏈接http:\\abc.com?=blahblahiframelink
。我想從該Iframe的內容中提取多個值。如何刮或解析iframe中的內容來獲得特定值
這裏是簡化的html。請理解,真正的HTML要複雜得多有多個div嵌套和表
.css stuff
<html>
<div>
<p> NEED THIS INFO </p>
....
blah blah
<img src="NEED THIS INFO" > </img>
</div>
</html>
我在上面的代碼標記爲"NEED THIS INFO"
什麼我想提取出來,以證明我想的屬性值以及元素的值。
我想首先商店,在我休息服務的Java字符串iframe中的內容,然後使用正則表達式的瘋狂得到我想要的信息。
在我嘗試之前,我想檢查是否有更有效的方法來做到這一點。是否有一些可用於以結構化格式獲取內容的html解析器。
如果不是那麼,請告訴我如何在Java字符串中存儲Iframe。
如果您需要更多信息,請讓我知道。
使用正則表達式解析HTML這裏有一些很好的建議:http://stackoverflow.com/a/1732454/138256 – codebox
你在瀏覽器中運行Java或客戶端的服務器這樣做? – Henrik
Jsoup的html解析器是最好的方法。 [這裏](http://jsoup.org/)是文檔的官方網站。 – Tugrul