2017-08-10 60 views
-2

我想知道如何提取特定標記下的所有元素。 例如:Python解析特定標記中的所有元素

<div class="text"> 
    <h2>...</h2> 
    <p>...</p> 
    <p>...</p> 
    <h2>...</h2> 
</div> 

我想在一個列表

list = ['<h2>...</h2>', 
     '<p>...</p>', 
     '<p>...</p>', 
     '<h2>...</h2>'] 

我之所以需要這個,我想知道在什麼類別(頭)文本用和提取得到這些元素文本。

回答

0
from bs4 import BeautifulSoup 
l = soup.find('div', {'class':'text'}).findChildren() 
相關問題