我使用BeautifulSoup來解析一些HTML。比方說,我有一個BeautifulSoup叫湯下麪的HTML:根據它所包圍的內容找到一個標籤(使用beautifulsoup)
<td class="1">test1</td>
<td>test2</td>
<td class="3"><a href="/">test3</a></td>
<td><div class="test4"><a class="test4" href="/">test4</a></div></td>
<td><div class="test4"><a class="test4" href="/">test4</a></div></td>
我可以得到所有「TD」標籤的物品有:
soup.findAll("td")
但我怎麼能找到只有「TD」標記,環繞有test4級的div嗎?或者用test4包圍'a'標籤?
我知道我能找到帶有屬性的標籤,如:
soup.findAll("a", {"class":"test4"})
但我需要這與最初的「TD」的搜索結合起來,讓我扔掉所有的「TD」沒有標籤環繞'a'或'div'標籤。
想法?謝謝!
當你說「環繞聲」時,你的意思是「是......的父母」還是「是......的祖先?」 – 2011-06-08 04:57:48
「是」 – mix 2011-06-08 18:04:00