我已將HTML內容傳遞給一個字符串,名爲「Html_content」。我需要解析字符串「Html_content」,並使用那裏選擇幾個DIV標籤ID說例如「fullHeader」是DIV的ID,我需要選擇「fullHeader」的div標籤內的內容並將其存儲爲字符串。解析字符串並收集具有不同編號的HTML元素
我試過JSOUP但我需要將收集的div標籤保存在Document中,但是我需要將它保存爲字符串,但它不可能使用Jsoup,有沒有其他選擇?
我已將HTML內容傳遞給一個字符串,名爲「Html_content」。我需要解析字符串「Html_content」,並使用那裏選擇幾個DIV標籤ID說例如「fullHeader」是DIV的ID,我需要選擇「fullHeader」的div標籤內的內容並將其存儲爲字符串。解析字符串並收集具有不同編號的HTML元素
我試過JSOUP但我需要將收集的div標籤保存在Document中,但是我需要將它保存爲字符串,但它不可能使用Jsoup,有沒有其他選擇?
JSoup正是你所需要的。我的理解是,你需要將HTML元素以字符串形式返回給你,以便你可以進一步使用它們來創建另一個文檔。
假設你有Element對象說ele從HTML中提取出來。
現在寫
字符串htmlForEle =新元素(Tag.valueOf( 「DIV」))附加(ele.clone())除去()HTML()。;
ele的html正是你正在尋找的。
如果您強制將HTML轉換爲XML語法,則可以使用XPath,SAX,DOM和其他XML工具來操作文檔。
但我需要將其保存爲字符串,但使用Jsoup
錯誤的不可能,Jsoup有這樣的一個Element#text()
方法。
String text = element.text(); // <div>foo<b>bar</b></div> will give "foobar"
// ...
或者當你要在字符串中包含的HTML以及使用Element.html()
或Element#outerHtml()
,根據需求。
String html = element.html(); // <div>foo<b>bar</b></div> will give "foo<b>bar</b>"
// ...
或
String html = element.outerHtml(); // <div>foo<b>bar</b></div> will give exact this string
// ...
謝謝BalusC你的回答幫了我很大忙,現在工作很好 – 2011-05-11 10:57:36
你的問題不清楚。你想引用html中的'div'元素並將它們放入字符串集合中嗎? – Jeremy 2011-05-10 13:31:32