2011-05-10 28 views
2

我已將HTML內容傳遞給一個字符串,名爲「Html_content」。我需要解析字符串「Html_content」,並使用那裏選擇幾個DIV標籤ID說例如「fullHeader」是DIV的ID,我需要選擇「fullHeader」的div標籤內的內容並將其存儲爲字符串。解析字符串並收集具有不同編號的HTML元素

我試過JSOUP但我需要將收集的div標籤保存在Document中,但是我需要將它保存爲字符串,但它不可能使用Jsoup,有沒有其他選擇?

+0

你的問題不清楚。你想引用html中的'div'元素並將它們放入字符串集合中嗎? – Jeremy 2011-05-10 13:31:32

回答

2

JSoup正是你所需要的。我的理解是,你需要將HTML元素以字符串形式返回給你,以便你可以進一步使用它們來創建另一個文檔。

假設你有Element對象說ele從HTML中提取出來。

現在寫

字符串htmlForEle =新元素(Tag.valueOf( 「DIV」))附加(ele.clone())除去()HTML()。;

ele的html正是你正在尋找的。

0

如果您強制將HTML轉換爲XML語法,則可以使用XPath,SAX,DOM和其他XML工具來操作文檔。

3

但我需要將其保存爲字符串,但使用Jsoup

錯誤的不可能,Jsoup有這樣的一個Element#text()方法。

String text = element.text(); // <div>foo<b>bar</b></div> will give "foobar" 
// ... 

或者當你要在字符串中包含的HTML以及使用Element.html()Element#outerHtml(),根據需求。

String html = element.html(); // <div>foo<b>bar</b></div> will give "foo<b>bar</b>" 
// ... 

String html = element.outerHtml(); // <div>foo<b>bar</b></div> will give exact this string 
// ... 
+0

謝謝BalusC你的回答幫了我很大忙,現在工作很好 – 2011-05-11 10:57:36