我想在字符串中SEACH爲標題標籤,我正在尋找一個正則表達式找到像何標題標籤出現在文檔中的索引,所以東西:Python的正則表達式
str.index('<h*>')
在哪裏*代表只有1個字符,即。 1,2,3等消除任何頭標籤或html標籤
任何幫助將不勝感激。
我想在字符串中SEACH爲標題標籤,我正在尋找一個正則表達式找到像何標題標籤出現在文檔中的索引,所以東西:Python的正則表達式
str.index('<h*>')
在哪裏*代表只有1個字符,即。 1,2,3等消除任何頭標籤或html標籤
任何幫助將不勝感激。
import re
matches = re.finditer('<h[1-6]>', your_text)
for match in matches:
print match.start()
您所需要的正則表達式是這樣的:
<h.>
這將匹配<h1>, <h2>, <hr>
,等等...如果你只想匹配標題標籤,使用:
<h\d>
水平規則不是標題。 – NullUserException
你可以使用''或'] +>'如果你想匹配''(例如:它有其他屬性 –
NullUserException
謝謝大家 – Ruth