-3
我已經收到網頁的HTML作爲字符串,並且我嘗試從包含在字符串中的HTML標記中提取值,更具體地說是元標記。我已經找到了通過jQuery做到這一點的方法,但是我使用的平臺不允許JQuery加上我提取的html在技術上是一個字符串,所以不需要html。我希望提取每個元標記並將其保存到數組中以供稍後使用。任何正則表達式解決方案?僅使用Javascript從HTML字符串中提取元標記
var rawHTML=input.rawHTML;
var HTMLlength=rawHTML.length;
var metas=rawHTML.split(">");
var testString="This is a <body>Test String for Regex</body>";
for(var i=0;i<metas.length;i++)
{
metas[i]=metas[i]+">";
}
var twitterResults;
for(var i=0;i<metas.length;i++)
{
metas[i]=strip_html_tags(metas[i]);
//twitterResults = testString.match(<TAG\b[^>]*>(.*?)<);
}
更重要的是,我試圖做一個正則表達式則表達式來提取這些標記爲
/<([A-Z][A-Z0-9]*)\b[^>]*>(.*?)</\1>
但似乎我不能打出來的正則表達式,並不會接受一個分號作爲分號,只是出錯
請分享字符串樣本,你的嘗試? – C2486