我正在解析HTML中的元標記。一切工作正常,但在某些情況下,我無法相應地解析meta標籤。無法從html解析元標記
這裏是標籤格式:<meta property="fb:pages" content="6456456"/>
正則表達式:string regexImgSrc = @"<meta property.*?>";
但有時我得到另一種格式meta標籤從HTML這樣的:
<meta data-react-helmet="true" property="article:publisher" content=""/>
所以正則表達式是不獲得預期的產出。 我只需要屬性名稱和meta標籤中的內容。 這裏是我的代碼
string regexImgSrc = @"<meta property.*?>";
MatchCollection matches = Regex.Matches(htmldata, regexImgSrc, RegexOptions.IgnoreCase | RegexOptions.Singleline);
請幫
在此先感謝
不建議使用正則表達式解析HTML。 html不規則,正則表達式用於正則表達式。 – jdweng
爲什麼你不使用HTML解析庫(Html Agility Pack)。它只是一個建議 –
不,我不想使用任何庫或第三方工具@Usman – sachin