提取div的內容？

2013-06-25 98 views 1 likes

如何在BS4提取的div內容：提取div的內容？

>>> Doc 
<div class="document"> 
<p>Text.</p> 
<p>More text</p> 
</div> 

>>> type(Doc) 
bs4.element.Tag

，我想

<p>Text.</p> 
<p>More text</p>

來源

2013-06-25 Adobe

回答

使用.contents：

>>> Doc = soup.find('div', {'class': 'document'}) # assuming soup is your main content 
>>> for i in [x for x in Doc.contents if x != '\n']: 
...  print i 
... 
<p>Text.</p> 
<p>More text</p>

來源

2013-06-25 11:40:20 TerryA

對不起 - 也許我應該說明它 - 但在div下可能會有任意複雜的html：表，列表等等。 – Adobe

@Adobe那麼只需打印div標籤的全部內容？ – TerryA

是的：'

CONTENTS

' - >'CONTENTS'。 – Adobe

得到公正的div的全部內容，無論其中包含哪些元素，請使用soup.find("div").prettify()來有效獲取內部HTML。

來源

2013-06-25 11:44:39 dav

我遇到了使用utf8的問題。我甚至不知道它是否根據需要剝離了div。 – Adobe

相關問題

11. 獲取Div類內容html
12. 在提交時顯示DIV的內容
13. 從小孩div獲取div內容onclick
14. 如何提取OLE容器的內容？
15. 使用C＃中的XPath提取div內容＃
16. C＃正則表達式提取一個div的內容
17. 的Python/BeautifoulSoup - 提取DIV內容檢查H1文字
18. 是否可以僅提取可滾動div的可見內容？
19. Scrapy：如何提取嵌套div（xpath選擇器）中的內容？
20. 用XPath提取內容？
21. 使用JSOUP提取內容
22. 提取網頁內容
23. 提取文件內容
24. 如何提取hashtag內容？
25. 提取內容：使用XPath
26. 提取窗口內容
27. XML內容提取C＃
28. 提取JSP頁面內容
29. 獲取HTML內容提交
30. 從HttpResponseMessage提取內容