爲什麼BeautifulSoup找不到所有標籤？

當我使用BeautifulSoup 4解析http://www.madcamcnc.com/sales.html，然後查找表標記時，它會找到2.當我查看頁面的html時，會看到10個表。爲什麼BeautifulSoup不會全部返回10？爲什麼BeautifulSoup找不到所有標籤？

from bs4 import BeautifulSoup 

import urllib2 

page = urllib2.urlopen("http://www.madcamcnc.com/sales.html") 
soup = BeautifulSoup(page) 
print len(soup.findAll('table'))

來源

2014-01-15 Mitch

它返回多少？ – 2014-01-15 04:58:09

這個問題似乎是脫離主題，因爲它是關於看錯網頁。 – MattDMo

查看源代碼顯示頁面的實際HTML源代碼中只有3個表格。其他表格必須在加載頁面後使用Javascript添加，這是BeautifulSoup沒有看到的。

BeautifulSoup只能在給定的HTML文檔上工作，但不會加載或執行Javascript，因此瀏覽器和文檔BeautifulSoup之間的差異處理。

enter image description here

來源

2014-01-15 04:59:40

你怎麼得到3，我得到2？我複製/粘貼源文件並搜索單詞「table」 - 四個匹配，每個'

'和'

'兩個'... – MattDMo

@MattDMo擊敗我...我在源代碼的屏幕截圖中添加了I看到。 – 2014-01-15 05:03:03

aha。您正在查看''' - sales_region.html'之一。 – <span class="text-secondary"> <small> <a rel="noopener" target="_blank" href="https://stackoverflow.com/users/1426065/">MattDMo</a></span> <span></span> </small> </span> </p> </div> </div> </div> </div> </div> </article> <div> <script async src="https://pagead2.googlesyndication.com/pagead/js/adsbygoogle.js"></script> <ins class="adsbygoogle" style="display:block" data-ad-client="ca-pub-6208739752673518" data-ad-slot="1038284119" data-ad-format="auto" data-full-width-responsive="true"></ins> <script> (adsbygoogle = window.adsbygoogle || []).push({}); </script> </div> <article class="board-top-1 padding-top-10"> <div class="post-col vote-info"> <span class="count">1<i class="fa fa-thumbs-up"></i></span> </div> <div class="post-offset"> <div class="answer fmt"> <p>只有兩套<code class="prettyprint-override"><table>...</table></code>標籤在該頁面的源...</p> <p>有很多更<code class="prettyprint-override"><tr></code>和<code class="prettyprint-override"><td></code>標籤，但只有兩個表。</p> </div> <div class="post-info"> <div class="post-meta row"> <p class="text-secondary col-lg-6"> <span class="source"> <a rel="noopener" target="_blank" href="https://stackoverflow.com/q/21129419">來源</a> </span> </p> <p class="text-secondary col-lg-6"> <span class="float-right date"> <span>2014-01-15 04:57:57</span> <a rel="noopener" target="_blank" href="https://stackoverflow.com/users/1426065/">MattDMo</a></span> </p> <p class="col-12"></p> <p class="col-12"></p></div> </div> </div> </article> </div> <div class="clearfix"> </div> <div class="relative-box"> <div class="relative">相關問題</div> <ul class="relative_list"> <li> 1. <a href="http://hk.uwenku.com/question/p-sfzqcpmh-bhe.html" target="_blank" title="BeautifulSoup找不到所有標籤"> BeautifulSoup找不到所有標籤 </a> </li> <li> 2. <a href="http://hk.uwenku.com/question/p-scwvnxpx-qp.html" target="_blank" title="BeautifulSoup（BS4）未找到所有標籤"> BeautifulSoup（BS4）未找到所有標籤 </a> </li> <li> 3. <a href="http://hk.uwenku.com/question/p-wvoazaga-bev.html" target="_blank" title="BeautifulSoup找不到標籤li"> BeautifulSoup找不到標籤li </a> </li> <li> 4. <a href="http://hk.uwenku.com/question/p-nnpwbqvy-zq.html" target="_blank" title="爲什麼我找不到h1標籤？"> 爲什麼我找不到h1標籤？ </a> </li> <li> 5. <a href="http://hk.uwenku.com/question/p-ccliyphp-ez.html" target="_blank" title="beautifulsoup找到特定標籤"> beautifulsoup找到特定標籤 </a> </li> <li> 6. <a href="http://hk.uwenku.com/question/p-eczoqqrm-bga.html" target="_blank" title="python beautifulSoup找到所有"> python beautifulSoup找到所有 </a> </li> <li> 7. <a href="http://hk.uwenku.com/question/p-dagnucti-pw.html" target="_blank" title="Python Beautifulsoup找到正確的標籤"> Python Beautifulsoup找到正確的標籤 </a> </li> <li> 8. <a href="http://hk.uwenku.com/question/p-zfooeojw-ss.html" target="_blank" title="用BeautifulSoup找到頂級標籤"> 用BeautifulSoup找到頂級標籤 </a> </li> <li> 9. <a href="http://hk.uwenku.com/question/p-sykmudcc-bkt.html" target="_blank" title="Python BeautifulSoup給出了多個標籤以查找所有"> Python BeautifulSoup給出了多個標籤以查找所有 </a> </li> <li> 10. <a href="http://hk.uwenku.com/question/p-svfcsrva-qc.html" target="_blank" title="使用BeautifulSoup查找所有包含AND NOT NOT的標籤b"> 使用BeautifulSoup查找所有包含AND NOT NOT的標籤b </a> </li> <div> <script async src="https://pagead2.googlesyndication.com/pagead/js/adsbygoogle.js"></script> <ins class="adsbygoogle" style="display:block; text-align:center;" data-ad-layout="in-article" data-ad-format="fluid" data-ad-client="ca-pub-6208739752673518" data-ad-slot="4606349252"></ins> <script> (adsbygoogle = window.adsbygoogle || []).push({}); </script> </div> <li> 11. <a href="http://hk.uwenku.com/question/p-ylnvpilv-ben.html" target="_blank" title="Python BeautifulSoup - 不同的結果找到並找到所有"> Python BeautifulSoup - 不同的結果找到並找到所有 </a> </li> <li> 12. <a href="http://hk.uwenku.com/question/p-bjdrkuev-zo.html" target="_blank" title="使用BeautifulSoup顯示p標籤內的所有b標籤"> 使用BeautifulSoup顯示p標籤內的所有b標籤 </a> </li> <li> 13. <a href="http://hk.uwenku.com/question/p-nkkuzptq-bev.html" target="_blank" title="BeautifulSoup爲什麼不從網頁中提取所有的HTML？"> BeautifulSoup爲什麼不從網頁中提取所有的HTML？ </a> </li> <li> 14. <a href="http://hk.uwenku.com/question/p-djocipqy-bcr.html" target="_blank" title="爲什麼BeautifulSoup不能在Python的表格中找到文本？"> 爲什麼BeautifulSoup不能在Python的表格中找到文本？ </a> </li> <li> 15. <a href="http://hk.uwenku.com/question/p-nzznnnav-qo.html" target="_blank" title="爲什麼Beautifulsoup不會按名稱找到這個輸入？"> 爲什麼Beautifulsoup不會按名稱找到這個輸入？ </a> </li> <li> 16. <a href="http://hk.uwenku.com/question/p-kilwpowx-ch.html" target="_blank" title="爲什麼Xamarin.forms上的標籤不顯示所有文本？"> 爲什麼Xamarin.forms上的標籤不顯示所有文本？ </a> </li> <li> 17. <a href="http://hk.uwenku.com/question/p-uitffsvk-bhe.html" target="_blank" title="爲什麼不是所有的標籤都返回？"> 爲什麼不是所有的標籤都返回？ </a> </li> <li> 18. <a href="http://hk.uwenku.com/question/p-czzjawgu-nd.html" target="_blank" title="爲什麼PHP標籤內的所有DIV不行"> 爲什麼PHP標籤內的所有DIV不行 </a> </li> <li> 19. <a href="http://hk.uwenku.com/question/p-vhkoxykf-cy.html" target="_blank" title="爲什麼我找不到使用jquery的標籤文本？"> 爲什麼我找不到使用jquery的標籤文本？ </a> </li> <li> 20. <a href="http://hk.uwenku.com/question/p-chuhxtso-kq.html" target="_blank" title="ForerunnerDB爲什麼找不到我的標籤？"> ForerunnerDB爲什麼找不到我的標籤？ </a> </li> <li> 21. <a href="http://hk.uwenku.com/question/p-hdfkbyfb-ou.html" target="_blank" title="爲什麼FindWindowEx在我的窗口中找不到標籤？"> 爲什麼FindWindowEx在我的窗口中找不到標籤？ </a> </li> <li> 22. <a href="http://hk.uwenku.com/question/p-erutijof-rs.html" target="_blank" title="試圖找到所有使用Beautifulsoup"> 試圖找到所有使用Beautifulsoup </a> </li> <li> 23. <a href="http://hk.uwenku.com/question/p-ptuwbiij-ou.html" target="_blank" title="用BeautifulSoup刮掉HTML表格不會返回所有標籤"> 用BeautifulSoup刮掉HTML表格不會返回所有標籤 </a> </li> <li> 24. <a href="http://hk.uwenku.com/question/p-hlpspbpf-hz.html" target="_blank" title="BeautifulSoup不搜索遞歸已找到標籤"> BeautifulSoup不搜索遞歸已找到標籤 </a> </li> <li> 25. <a href="http://hk.uwenku.com/question/p-ylwdxkke-bp.html" target="_blank" title="在找不到beautifulsoup標籤，當我通過字典"> 在找不到beautifulsoup標籤，當我通過字典 </a> </li> <li> 26. <a href="http://hk.uwenku.com/question/p-xhynuuwz-bcd.html" target="_blank" title="找不到標籤和正則表達式BeautifulSoup"> 找不到標籤和正則表達式BeautifulSoup </a> </li> <li> 27. <a href="http://hk.uwenku.com/question/p-bilcgiyy-wz.html" target="_blank" title="爲什麼Selenium和PhantomJS找不到標籤，但Selenium和Chromedriver可以找到標籤？"> 爲什麼Selenium和PhantomJS找不到標籤，但Selenium和Chromedriver可以找到標籤？ </a> </li> <li> 28. <a href="http://hk.uwenku.com/question/p-wlpggtso-zo.html" target="_blank" title="BeautifulSoup：表找不到"> BeautifulSoup：表找不到 </a> </li> <li> 29. <a href="http://hk.uwenku.com/question/p-nvafbuwg-ep.html" target="_blank" title="爲什麼我得到我的emacs標籤不是有效的標籤表？"> 爲什麼我得到我的emacs標籤不是有效的標籤表？ </a> </li> <li> 30. <a href="http://hk.uwenku.com/question/p-yabsoffe-tm.html" target="_blank" title="爲什麼不能在提取的響應中找到所有標題？"> 爲什麼不能在提取的響應中找到所有標題？ </a> </li> </ul> </div> <div> <script async src="https://pagead2.googlesyndication.com/pagead/js/adsbygoogle.js"></script> <ins class="adsbygoogle" style="display:block" data-ad-format="autorelaxed" data-ad-client="ca-pub-6208739752673518" data-ad-slot="1575177025"></ins> <script> (adsbygoogle = window.adsbygoogle || []).push({}); </script> </div> <div class="padding-top-10"></div> </div> </div> <script type="text/javascript" src="http://img.uwenku.com/uwenku/script/side.js?t=1644592048261"></script> <script type="text/javascript" src="http://img.uwenku.com/uwenku/plugin/highlight/highlight.pack.js"></script> <link href="http://img.uwenku.com/uwenku/plugin/highlight/styles/docco.css" media="screen" rel="stylesheet" type="text/css" /> <script type="text/javascript"> $('pre').each(function(i, e) { hljs.highlightBlock(e, "<span class='indent'> </span>", false) }); </script> <div class="col-lg-3 col-md-4 col-sm-5"> <div id="rightTop"> <div class="row"> <script async src="https://pagead2.googlesyndication.com/pagead/js/adsbygoogle.js"></script> <ins class="adsbygoogle" style="display:block" data-ad-client="ca-pub-6208739752673518" data-ad-slot="5415218910" data-ad-format="auto" data-full-width-responsive="true"></ins> <script> (adsbygoogle = window.adsbygoogle || []).push({}); </script> </div> <div class="row sidebar panel panel-default"> <div class="panel-heading font-bold"> 最新問題 </div> <div class="m-b-sm m-t-sm clearfix"> <ul class="side_article_list"> <li class="side_article_list_item"> 1. <a href="http://hk.uwenku.com/question/p-fkkjwjzq-qt.html" target="_blank" title="多層次按菜單角4"> 多層次按菜單角4 </a> </li> <li class="side_article_list_item"> 2. <a href="http://hk.uwenku.com/question/p-csctcjgp-rc.html" target="_blank" title="Yodlee providerAccounts REST端點憑證"> Yodlee providerAccounts REST端點憑證 </a> </li> <li class="side_article_list_item"> 3. <a href="http://hk.uwenku.com/question/p-qgmmappj-ro.html" target="_blank" title="體面性能Gem5系統要求"> 體面性能Gem5系統要求 </a> </li> <li class="side_article_list_item"> 4. <a href="http://hk.uwenku.com/question/p-dfaghluo-rx.html" target="_blank" title="熊貓：從行的特定列中選擇值"> 熊貓：從行的特定列中選擇值 </a> </li> <li class="side_article_list_item"> 5. <a href="http://hk.uwenku.com/question/p-zeeftwxs-pp.html" target="_blank" title="Bypass Itunes Connect Testflight應用程序-β審查"> Bypass Itunes Connect Testflight應用程序-β審查 </a> </li> <li class="side_article_list_item"> 6. <a href="http://hk.uwenku.com/question/p-blslbebm-ou.html" target="_blank" title="Android Studio錯誤安裝Java"> Android Studio錯誤安裝Java </a> </li> <li class="side_article_list_item"> 7. <a href="http://hk.uwenku.com/question/p-nvlblvfn-pd.html" target="_blank" title="根vs自舉組件"> 根vs自舉組件 </a> </li> <li class="side_article_list_item"> 8. <a href="http://hk.uwenku.com/question/p-krlhbaih-nz.html" target="_blank" title="滾動到div的ID，堆疊後「停止」 DIV ID隱藏（不smoth滾動）"> 滾動到div的ID，堆疊後「停止」 DIV ID隱藏（不smoth滾動） </a> </li> <li class="side_article_list_item"> 9. <a href="http://hk.uwenku.com/question/p-xhraizgw-ok.html" target="_blank" title="如何模擬來電？"> 如何模擬來電？ </a> </li> <li class="side_article_list_item"> 10. <a href="http://hk.uwenku.com/question/p-yngkhxee-ne.html" target="_blank" title="預期一個字符串，但是BEGIN_ARRAY- Gson"> 預期一個字符串，但是BEGIN_ARRAY- Gson </a> </li> </ul> </div> </div> </div> <p class="article-nav-bar"></p> <div class="row sidebar article-nav"> <div class="row box_white visible-sm visible-md visible-lg margin-zero"> <div class="top"> <h3 class="title"><i class="glyphicon glyphicon-th-list"></i> 相關問題</h3> </div> <div class="article-relative-content"> <ul class="side_article_list"> <li class="side_article_list_item"> 1. <a href="http://hk.uwenku.com/question/p-sfzqcpmh-bhe.html" target="_blank" title="BeautifulSoup找不到所有標籤"> BeautifulSoup找不到所有標籤 </a> </li> <li class="side_article_list_item"> 2. <a href="http://hk.uwenku.com/question/p-scwvnxpx-qp.html" target="_blank" title="BeautifulSoup（BS4）未找到所有標籤"> BeautifulSoup（BS4）未找到所有標籤 </a> </li> <li class="side_article_list_item"> 3. <a href="http://hk.uwenku.com/question/p-wvoazaga-bev.html" target="_blank" title="BeautifulSoup找不到標籤li"> BeautifulSoup找不到標籤li </a> </li> <li class="side_article_list_item"> 4. <a href="http://hk.uwenku.com/question/p-nnpwbqvy-zq.html" target="_blank" title="爲什麼我找不到h1標籤？"> 爲什麼我找不到h1標籤？ </a> </li> <li class="side_article_list_item"> 5. <a href="http://hk.uwenku.com/question/p-ccliyphp-ez.html" target="_blank" title="beautifulsoup找到特定標籤"> beautifulsoup找到特定標籤 </a> </li> <li class="side_article_list_item"> 6. <a href="http://hk.uwenku.com/question/p-eczoqqrm-bga.html" target="_blank" title="python beautifulSoup找到所有"> python beautifulSoup找到所有 </a> </li> <li class="side_article_list_item"> 7. <a href="http://hk.uwenku.com/question/p-dagnucti-pw.html" target="_blank" title="Python Beautifulsoup找到正確的標籤"> Python Beautifulsoup找到正確的標籤 </a> </li> <li class="side_article_list_item"> 8. <a href="http://hk.uwenku.com/question/p-zfooeojw-ss.html" target="_blank" title="用BeautifulSoup找到頂級標籤"> 用BeautifulSoup找到頂級標籤 </a> </li> <li class="side_article_list_item"> 9. <a href="http://hk.uwenku.com/question/p-sykmudcc-bkt.html" target="_blank" title="Python BeautifulSoup給出了多個標籤以查找所有"> Python BeautifulSoup給出了多個標籤以查找所有 </a> </li> <li class="side_article_list_item"> 10. <a href="http://hk.uwenku.com/question/p-svfcsrva-qc.html" target="_blank" title="使用BeautifulSoup查找所有包含AND NOT NOT的標籤b"> 使用BeautifulSoup查找所有包含AND NOT NOT的標籤b </a> </li> </ul> </div> </div> </div> </div> </div> </div> </div>  <footer id="footer"> <div class="bg-simple lt"> <div class="container"> <div class="row padder-v m-t"> <div class="col-xs-8"> <ul class="list-inline"> <li><a href="http://hk.uwenku.com/contact">聯系我們</a></li> <li>© 2020 HK.UWENKU.COM</li> <li><a target="_blank" href="https://beian.miit.gov.cn/">沪ICP备13005482号-4</a></li> <li><script type="text/javascript" src="https://v1.cnzz.com/z_stat.php?id=1280101193&web_id=1280101193"></script></li> <li><a href="http://www.uwenku.com/" target="_blank" title="优文库">简体中文</a></li> <li><a href="http://hk.uwenku.com/" target="_blank" title="優文庫">繁體中文</a></li> <li><a href="http://ru.uwenku.com/" target="_blank" title="поле вопросов и ответов">Русский</a></li> <li><a href="http://de.uwenku.com/" target="_blank" title="Frage - und - antwort - Park">Deutsch</a></li> <li><a href="http://es.uwenku.com/" target="_blank" title="Preguntas y respuestas">Español</a></li> <li><a href="http://hi.uwenku.com/" target="_blank" title="कार्यक्रम प्रश्न और उत्तर पार्क">हिन्दी</a></li> <li><a href="http://it.uwenku.com/" target="_blank" title="IL Programma di chiedere Park">Italiano</a></li> <li><a href="http://ja.uwenku.com/" target="_blank" title="プログラム問答園区">日本語</a></li> <li><a href="http://ko.uwenku.com/" target="_blank" title="프로그램 문답 단지">한국어</a></li> <li><a href="http://pl.uwenku.com/" target="_blank" title="program o park">Polski</a></li> <li><a href="http://tr.uwenku.com/" target="_blank" title="Program soru ve cevap parkı">Türkçe</a></li> <li><a href="http://vi.uwenku.com/" target="_blank" title="Đáp ứng viên">Tiếng Việt</a></li> <li><a href="http://fr.uwenku.com/" target="_blank" title="Programme interrogation Park">Française</a></li> </ul> </div> </div> </div> </div> </div> </footer>  <script> var _hmt = _hmt || []; (function() { var hm = document.createElement("script"); hm.src = "https://hm.baidu.com/hm.js?f78a970f17b19a79fc477a3378096f29"; var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(hm, s); })(); </script> </body> </html>

爲什麼BeautifulSoup找不到所有標籤？

回答