2013-12-20 136 views
1

我需要從以下結構BeautifulSoup解析嵌套div標籤

<div> 
A 
    **<div>** 
    B 
     <div> 
     C 
     </div> 
    </div> 
</div> 

<div> 
A 
    **<div>** 
    B 
     <div> 
     C 
     </div> 
    </div> 
</div> 

我曾經選擇做這個選擇第二個div:

divs = soup.select("div > div") 

但隨着第二個div一起和它的內容,它也選擇第三個div作爲列表的一部分。如何在我的退貨清單中只選擇標有的div。

回答

0

在Python中,你可以使用以下行:

# select all the div tags in page 
divs = soup.find_all('div') 

for item in divs:  
    inner_div = item.div 

首先,你選擇所有div標籤,然後你自主選擇每一個。如果您想翻譯成其他語言,請訪問該語言的美麗湯頁。