2016-06-08 96 views
0

我怎麼能匹配跨度開始和結束標記與樣式屬性?:之間的文本正則表達式<span>標籤的風格屬性

<span style="white-space: pre-line">some text</span> 

我嘗試了以下模式,但它不工作:

<span style=\"white-space: pre-line\">(.*)</span> 
+1

你問我們的正則表達式嗎?如果是這樣,然後查找後面的看看和前瞻斷言 – Toxicable

+0

其實我明白,用正則表達式搜索html是一個壞主意。現在我正在尋找如何將html文本轉換爲普通文本。 – user2598794

+1

我會建議起訴nuget包:HTML敏捷包https://www.nuget.org/packages/HtmlAgilityPack。它使得HTML遍歷非常容易 – Toxicable

回答

1

首先,it is in general a bad idea to parse HTML with a Regex

使用解析HTML來解析HTML會更好,如HTML Agility Pack

這就是說,如果你需要正則表達式的幫助,你可以下載一個工具來幫助你分析和測試它們。有幾種可用的工具,我個人喜歡Expresso

在這種特殊情況下,我認爲你的空間有問題,但我不確定,因爲你沒有顯示你用來構建正則表達式的RegexOptions。嘗試

<span\s*style=\"white-space:\s*pre-line\">(.*)</span> 
+0

@MaximilianAst:爲什麼有必要逃避'/'? –

+0

Sry我的壞。忘了'/'不能在.NET中轉義 –

相關問題