2017-07-06 60 views
-1

餘米試圖消除所有的HTML標籤內的一切:標籤之間移除所有的正則表達式

輸入:

<a class="yoyo"> <h1 id="test"> hello </h1> </a> 

怪異的例子,但也

輸出:

<a><h1>hello</h1></a> 

我已經嘗試/(<\w)(?:.*)(>)/gmi,但它不工作...

如果您對此有任何線索。 感謝


所以要解釋它更多您的評論後,我報廢了一個網站,我有我想要一個乾淨的.txt文件。它將包含一個頁面的整個html,我想清理每一個html標籤並刪除空格。 因此,任何< *和>之間的內容都應該刪除。

+0

你能否解釋一下?你可以在html標籤裏面有一百萬個html標籤,你想要做什麼? –

+0

正則表達式是否必須將「hello」改爲「salut」並刪除空格?只是開玩笑你好,但我認真的空間.. – Kaddath

+0

不要這樣做與正則表達式。 –

回答

0

使用DOM方法做到這一點。遍歷所有元素,重複的屬性和刪除它們

let cont = document.getElementById('demo-container'), 
 
    els = cont.querySelectorAll('*'); 
 

 
[].slice.call(els).forEach(el => { 
 
    [].slice.call(el.attributes).forEach(attr => { 
 
    el.removeAttribute(attr.name); 
 
    }) 
 
}); 
 

 
console.log(cont.innerHTML)
<div id="demo-container"> 
 
    <a class="yoyo"> 
 
    <h1 id="test"> hello </h1> 
 
    </a> 
 
</div>

相關問題