文件看起來是這樣的:如何使用BeautifulSoup按標籤分割文檔?
<div class="eh">...</div>
...
<section class="g">...</section> <!-- div 1 -->
...
<section class="g">...</section> <!-- div 1 -->
...
<div class="eh">...</div>
...
<section class="g">...</section> <!-- div 2 -->
...
所有這些標籤在同一棵樹上的水平。我需要將文檔分割爲多個div的組,並將各個部分附加到其相應的div。
預期結果是一個列表,如[div1, section1, section2, div2, section3]
。它們按照它們在HTML中出現的順序顯示。
我當前的代碼:
bs.find_all(
['div', 'section'],
{'class': ['eh', 'g']})
這個工作,如果股利和部分有不同的類別。
到目前爲止您嘗試過的是什麼? – Prabhakar