2016-03-21 16 views
1

這裏提取後的文本是HTML文件,我要處理:的Python:前<br/>

<span class="pl">Countries:</span> USA <br/> 
<span class="pl">Language:</span> English <br/> 

這裏是我的Python代碼:

from bs4 import BeautifulSoup 

record=[] 
soup=BeautifulSoup(html) 
spans=soup.find_all('span') 
for span in spans: 
    record.append(span.text) 

我最後得到的是:

Countries: Language: 

結果錯過了一些重要的信息:「USA」和「English」 如何獲取文本?

回答

2

使用.next_sibling符號:

soup.find("span", text="Countries:").next_sibling 
soup.find("span", text="Language:").next_sibling 
+0

真棒!謝謝!! – KengoTokukawa