4
我使用Python和BeautifulSoup從html中提取一些文本。我有一些HTML格式的文本用BeautifulSoup刪除不必要的重複標記
<h3><b> Abc </b><b> DEF </b> </h3>
我想刪除重複的b標籤。有沒有快速的方法來做到這一點?
我使用Python和BeautifulSoup從html中提取一些文本。我有一些HTML格式的文本用BeautifulSoup刪除不必要的重複標記
<h3><b> Abc </b><b> DEF </b> </h3>
我想刪除重複的b標籤。有沒有快速的方法來做到這一點?
對於BS4這似乎只是正常工作
In [4]: soup.h3
Out[4]: <h3><b> Abc </b><b> DEF </b> </h3>
In [5]: soup.h3.text
Out[5]: u' Abc DEF '
退房的文檔,這裏的包: https://beautiful-soup-4.readthedocs.org/en/latest/ https://pypi.python.org/pypi/beautifulsoup4