得到一個值從@href屬性

我再殺一個網站，有基於JavaScript的系統分頁，所以我想從@href屬性提取頁碼，這是怎樣的鏈接看看：得到一個值從@href屬性

<a href="javascript:AllerAPage('1', 'element_id');">Page 1</a>

sel.xpath('//a/@href').re(r"javascript:AllerAPage\('(\d+)',")

注意//a/@href的XPath exression就是一個例子 - 您可以有不同的一個。

演示展示了我所提供的正則表達式的工作：

>>> import re 
>>> s = "javascript:AllerAPage('1', 'element_id');" 
>>> re.search("javascript:AllerAPage\('(\d+)',", s).group(1) 
'1'

2014-05-21 17:36:06 alecxe

它的神奇，感謝ü:) –

回答