我有一個大的HTML數據字符串分成小塊。我正在嘗試編寫一個PowerShell腳本來刪除所有的HTML標記,但我發現很難找到正確的正則表達式模式。Powershell刪除字符串內容中的HTML標記
例字符串:
<p>This is an example</br>of various <span style="color: #445444">html content</span>
我已經嘗試使用:
$string -replace '\<([^\)]+)\>',''
它與簡單的例子,但那些,如上述它捕獲整個字符串。
任何建議什麼是最好的方式來實現這一目標?
在此先感謝
謝謝你完美地工作 – Arturski
你最終使用正則表達式還是解析器? – briantist
我用的正則表達式,迄今爲止運行良好,因爲我的腳本已經相當大,我手動解析的HTML,但圖書館看起來相當不錯,我會嘗試在我的其他項目,謝謝 – Arturski