假如我有一個HTML字符串是這樣的:如何使用Python中的BeautifulSoup提取標籤內的文本?
<html>
<div id="d1">
Text 1
</div>
<div id="d2">
Text 2
<a href="http://my.url/">a url</a>
Text 2 continue
</div>
<div id="d3">
Text 3
</div>
</html>
我想提取的d2
的內容,不其他標籤包裹,跳過a url
。換句話說,我想得到這樣的結果:
Text 2
Text 2 continue
有沒有辦法用BeautifulSoup做到這一點?
我嘗試這樣做,但它是不正確的:
soup = BeautifulSoup(html_doc, 'html.parser')
s = soup.find(id='d2').text
print(s)