0
我有一個html字符串。我想將所有段落分割成數組列表。但是分割的段落應該不是空的。被拆分的段落應該包含一些正常的文本,如果它只包含html文本,並且它內部沒有正常的文本,如:<htmltag> </htmltag>
,那麼它應該銷燬或不拆分。從html字符串拆分段並刪除空的段落
這是怎樣一段HTML字符串中拆分例如:
System.Text.RegularExpressions.Match m = System.Text.RegularExpressions.Regex.Match(htmlString, @"<p>\s*(.+?)\s*</p>");
ArrayList groupCollection = new ArrayList();
while (m.Success)
{
groupCollection.Add(m.Value);
m = m.NextMatch();
}
ArrayList paragraphs = new ArrayList();
if (groupCollection.Count > 0)
{
foreach (object item in groupCollection)
{
paragraphs.Add(item);
}
}
上面的代碼可以分割的所有段落,但它不能識別哪些段落是空的就像我上面說的。
你試過了什麼? – 2013-03-19 04:09:57
我已經嘗試RegularExpressions從html字符串拆分所有段落。但後來我不確定它是空的。 – 2013-03-19 04:11:01
你可以發佈你的代碼與問題..? – 2013-03-19 04:11:46