我有這個任務:我必須閱讀一個HTML文件,並匹配所有<a>
標籤及其所有屬性並打印出來。例如:標籤:
<a href="https://www.facebook.com" alt="Facebook icon" title="Facebook" target="_blank"></a>
正則表達式在一個文件中搜索
要打印:
href - https://www.facebook.com
alt - Facebook icon
title - Facebook
target- _blank
text – not found
我有正則表達式的基本知識,並從Java中的文件讀取零知識。有人能給我一些提示,建議和解釋如何有效地做到這一點?
爲<a>
標籤的所有屬性和閉幕</a>
匹配正則表達式的表達,在我看來,可能是:
"\<[aA]\w\>\w\<\/[aA]\>*"
這是一門功課? – Toto
你爲什麼不嘗試解析器? –
你可能想看看這個問題及其最佳答案:http://stackoverflow.com/questions/1732348/regex-match-open-tags-except-xhtml-self-contained-tags – benzonico