我遇到一個問題,它可能很容易,但我沒有在文檔中看到它。Python BeautifulSoup只選擇頂部標籤
這裏是目標html結構,非常簡單。
<h3>Top
<em>Mid</em>
<span>Down</span>
</h3>
我想這是h3
標籤內的「頂」的文字,我寫這個
from bs4 import BeautifulSoup
html ="<h3>Top <em>Mid </em><span>Down</span></h3>"
soup = BeautifulSoup(html)
print soup.select("h3")[0].text
但它會返回Top Mid Down
,我怎麼修改呢?
謝謝,我會檢查更多關於'contents'和'children'的細節 –