我需要RegEx模式來提取圖像標記的所有屬性。提取HTML圖像屬性的RegEx
衆所周知,HTML中存在大量格式錯誤的HTML,因此該模式必須涵蓋這些可能性。
我一直在尋找這種解決方案https://stackoverflow.com/questions/138313/how-to-extract-img-src-title-and-alt-from-html-using-php,但它並沒有完全得到這一切:
我拿出這樣的:
(alt|title|src|height|width)\s*=\s*["'][\W\w]+?["']
有我會想念任何可能性,或者更高效的簡單模式?
編輯:
對不起,我將更具體,我正在做這個使用.NET,所以它在服務器端。
我已經有一個img標籤列表,現在我只需要解析屬性。
regexHtmlParserQuestions ++ – annakata 2008-12-08 17:39:09