標籤我要分析此網址:http://online.wsj.com/public/page/news-wall-street-heard.html?dsk=y刪除<textarea>從書籍DOC
Document jDoc = Jsoup.connect(url1).get();
System.out.println(jDoc1.text());
但第二線(上圖)的輸出是內部的textarea +其他標籤的所有文本標籤。輸出如下:
..
..
<ul class="">
<li><a data-time="1dy" data-frequency="1mi" class="mdm_time">1 Day</a></li>
<li><a data-time="5dy" data-frequency="15mi" class="mdm_time">5 Days</a></li>
..
..
所有的html都被打印(內部是什麼)和其他標籤的文本。我想要從Doc中刪除這個標籤,或者想要將它作爲元素,以便我可以將其從我的手中刪除。
希望,我能夠清楚地解釋一切。請幫我解決這個問題。
編輯:
按照建議,我這樣做:
System.out.println(jDoc1.select("textarea"));
,輸出來的是:
textarea id="wsj_autocomplete_template" style="display:none">
<div>
<div class="acHeadline hidden" >
</div>
<div class="dropdownContainerClass">
<div class="suggestionblock hidden" templateType="C1">
....
...
..
當然,這是選擇textarea的,但不能解析內部元素。可能是由於& lt而不是<標籤。有沒有解決方法?
謝謝,我想刪除它,所以刪除使用.remove()。 – akshayb