這是我的HTML代碼的一部分:正則表達式在Python - 找到所有的樣式表在HTML
<link rel ="stylesheet" type="text/css" href="catalog/view/theme/default/stylesheet/stylesheet.css" />
<link id='all-css-0' href='http://1' type='text/css' media='all' rel='stylesheet' />
<link rel='stylesheet' id='all-css-1' href = 'http://2' type='text/css' media='all' />
我必須找到樣式表的所有的HREF。
我試圖用正則表達式像
<link\s+rel\s*=\s*["']stylesheet["']\s*href\s*=\s*["'](.*?)["'][^>]*?>
完整的代碼
body = '''<link rel ="stylesheet" type="text/css" href="catalog/view/theme/default/stylesheet/stylesheet.css" />
<link id='all-css-0' href='http://1' type='text/css' media='all' rel='stylesheet' />
<link rel='stylesheet' id='all-css-1' href = 'http://2' type='text/css' media='all' />''''
real_viraz = '''<link\s+rel\s*=\s*["']stylesheet["']\s*href\s*=\s*["'](.*?)["'][^>]*?>'''
r = re.findall(real_viraz, body, re.I|re.DOTALL)
print r
但問題是,相對= '樣式表'和HREF = ''可在<link ...>
的任何順序,它可以幾乎是他們之間的一切。
請幫我找到正確的正則表達式。謝謝。
我想有人會在這裏粘貼一個非常著名的鏈接... – Birei
我在等待:) – SKulibin