2016-08-23 23 views
1

我刮的用戶名和所有的人都在同一個標​​籤和他們的HREF中都開始一樣的,就像這樣:如何使用BeautifulSoup從具有特定開始的標籤只獲取字符串?

<a href="http://lolprofile.net/summoner/eune/Sadastyczny" class="link5">Sadastyczny</a> 

我試圖發現,只有當他們擁有一流的link5但也有其他的值是有我不想刮的那個課。那麼,有沒有一種方法來搜索所有這些都是

href="http://lolprofile.net/summoner" 
在他們

但不能休息,因爲這顯然是爲每一個用戶名不同的標籤?

+0

'links = [i for soup.find_all('a')if i.attrs.get('class')=='link5']' – n1c9

回答

1

BeautifulSoup documentation

使用正則表達式可以匹配網站。如果你從來沒有聽說過的正則表達式,你可以使用這個:

soup.find_all(href=re.compile("http://lolprofile.net/summoner/*"))

不要忘了導入re -module!

+0

正是我需要的,我會研究一下模塊,非常感謝! – edsheeran

相關問題