我想找到除了內<div id="nav">
如何獲得免費的HTML內容的非div標籤
舉例而言,所有標籤的免費的HTML內容的標籤,具有以下HTML:
<div id="nav">
<h1>Navigate!</h1>
<nav role="navigation">
<h2 class="structural">Main navigation</h2>
<ul>
<li><a href="/">Home</a></li>
<li><a href="/about/">About</a></li>
</ul>
</nav>
<div id="inside_nav">
<ul>
<li><a href="/">inside_home</a></li>
<li><a href="/about/">inside_About</a></li>
</ul>
</div>
</div>
代碼:
div = soup1.find("div", id="nav")
def match_only_non_divs(tag):
return (tag.findParent("div").get('id') == div.get('id')) and tag.name != "div"
print div.findAll(match_only_non_divs, text=True)
此代碼應輸出:
[u'\n', u'Navigate!', u'Main navigation',
u'Home', u'About', u'\n']
但是!它實際上是輸出:
[u'\n', u'Navigate!', u'Main navigation',
u'Home', u'About', u'\n',
u'inside_home', u'inside_About', u'\n']
的代碼不應該走內部的div內(ID =「inside_nav」),但它是內部的準備。 請幫忙!!你
謝謝約翰! – Jamal
不客氣。 –