6
從這個網站源之前提取文本:使用BeautifulSoup第一個孩子標籤
<div class="category_link">
Category:
<a href="/category/personal">Personal</a>
</div>
我想提取文本Category:
下面是使用Python/BeautifulSoup(以輸出爲註釋我嘗試 - 之後#)
parsed = BeautifulSoup(sample_html)
parsed_div = parsed.findAll('div')[0]
parsed_div.firstText() # <a href="/category/personal">Personal</a>
parsed_div.first() # <a href="/category/personal">Personal</a>
parsed_div.findAll()[0] # <a href="/category/personal">Personal</a>
我希望有一個「文本節點」可作爲第一個孩子。有關我如何解決這個問題的任何建議?
'parsed_div.contents [0]' – Avaris 2012-04-14 16:37:35