我是新來的Beautifulsoup 4,發現它真的很方便!但是,我得到了這個問題,當我需要拆分字符串:Beautifulsoup提取字符串部分
這裏有一個例子:
我,如果我一個鏈接,是
<a href="http://nihao-wobuhao?%93%23%24%12&sort=102">NIHAO</a>
我得到符合soap.findChildren('a')
,但什麼只需要'sort = 102'部分?
我試圖使用soap.find_all(re.compile(^sort=.*?))
但它不起作用,任何人都可以幫助我嗎?提前致謝!
提取'href'屬性,然後使用'urlparse'模塊解析它。 –