我有一堆HTML頁面,我想將CSS格式的文本片段轉換爲標準HTML標記。 e.g <span class="bold">some text</span>
將成爲<b>some text</b>
用Python中的正則表達式替換嵌套字符串
我被堵在嵌套span
片段:
<span class="italic"><span class="bold">XXXXXXXX</span></span>
<span class="italic">some text<span class="bold">nested text<span class="underline">deep nested text</span></span></span>
我想使用Python的正則表達式庫中的片段轉換。正則表達式搜索的最佳策略是什麼? - 取代上述輸入?
爲什麼必須通過正則表達式來完成? – hwnd
這只是個人喜好。我知道這可以通過recusive純字符串搜索來完成......但不知怎的,我發現正則表達式的解決方案更優雅...... – masroore
最佳策略實際上是使用正則表達式以外的其他東西,而這些正則表達式對此非常不利。 [美麗的湯](http://www.crummy.com/software/BeautifulSoup/)是用Python解析HTML的最流行的解決方案。 –