1
我再殺一個網站,有基於JavaScript的系統分頁,所以我想從@href屬性提取頁碼,這是怎樣的鏈接看看:得到一個值從@href屬性
<a href="javascript:AllerAPage('1', 'element_id');">Page 1</a>
我再殺一個網站,有基於JavaScript的系統分頁,所以我想從@href屬性提取頁碼,這是怎樣的鏈接看看:得到一個值從@href屬性
<a href="javascript:AllerAPage('1', 'element_id');">Page 1</a>
Scrapy selectors支持regular expressions:
sel.xpath('//a/@href').re(r"javascript:AllerAPage\('(\d+)',")
注意//a/@href
的XPath exression就是一個例子 - 您可以有不同的一個。
演示展示了我所提供的正則表達式的工作:
>>> import re
>>> s = "javascript:AllerAPage('1', 'element_id');"
>>> re.search("javascript:AllerAPage\('(\d+)',", s).group(1)
'1'
它的神奇,感謝ü:) –