僅使用Javascript從HTML字符串中提取元標記

-3

我已經收到網頁的HTML作爲字符串，並且我嘗試從包含在字符串中的HTML標記中提取值，更具體地說是元標記。我已經找到了通過jQuery做到這一點的方法，但是我使用的平臺不允許JQuery加上我提取的html在技術上是一個字符串，所以不需要html。我希望提取每個元標記並將其保存到數組中以供稍後使用。任何正則表達式解決方案？僅使用Javascript從HTML字符串中提取元標記

var rawHTML=input.rawHTML; 
var HTMLlength=rawHTML.length; 
var metas=rawHTML.split(">"); 
var testString="This is a <body>Test String for Regex</body>"; 
for(var i=0;i<metas.length;i++) 
    { 
    metas[i]=metas[i]+">"; 
    } 
var twitterResults; 
for(var i=0;i<metas.length;i++) 
    { 
    metas[i]=strip_html_tags(metas[i]); 
    //twitterResults = testString.match(<TAG\b[^>]*>(.*?)<); 
    }

更重要的是，我試圖做一個正則表達式則表達式來提取這些標記爲

/<([A-Z][A-Z0-9]*)\b[^>]*>(.*?)</\1>

但似乎我不能打出來的正則表達式，並不會接受一個分號作爲分號，只是出錯

來源

2017-10-17 Anthony Trischitti

請分享字符串樣本，你的嘗試？ – C2486

你可以使用一個正則表達式，但我實際上將字符串加載到DOM documentFragment，然後通過查找1類型的節點來解析meta標記的片段一個nodeName === META。

來源

2017-10-17 17:32:51

僅使用Javascript從HTML字符串中提取元標記

回答

相關問題