2016-01-29 91 views
0

我使用的是美麗的手來刮取一些基本的數據。我需要的部分源代碼是:颳去div標籤裏面的文字

<div class="header-team">Team name 1</div> 

<div class="header-team">Team name 2</div> 

這兩條線彼此不相鄰。

我想這一點:

for team in soup.findAll('div', 'header-team') 
    print team 

但得到所有的代碼返回。我曾嘗試添加.text,但它返回一個錯誤。

回答

1

下面代碼工作到我 -

from bs4 import BeautifulSoup as bs 

data = """<div class="header-team">Team name 1</div> 

<div class="header-team">Team name 2</div>""" 

soup = bs(data,'lxml') 

for team in soup.findAll('div', 'header-team'): 
    print team.text 

輸出 -

Team name 1 
Team name 2