2011-02-10 51 views

回答

6

首先是從HTML title標籤提取所述內容。

第二個是從HTML文檔中提取圖像'src屬性,但是非常不完美(它不會捕獲以.jpeg結尾或根本沒有擴展名的圖像資源的引用)。

用於解析HTML的正則表達式爲not a good idea應該是use a HTML parser instead。它們遠非防火。

+0

@皮卡是的,總是告訴[不要那樣](http://www.codinghorror.com/blog/2009/11/parsing-html-the-cthulhu-way.html)。 +1 –

+0

請注意,如果該行(或在多行模式下,_entire document_)具有多個「」元素,則第一個正則表達式將失敗。對於這種特殊情況,這可能不太可能,但通常會產生非常糟糕的結果。 – <span class="text-secondary"> <small> <span></span> </small> </span> </p> </div> </div> </div> <div itemprop="comment" class="post-comment"> <div class="row"> <div class="col-lg-1"><span class="text-secondary">+1</span></div> <div class="col-lg-11"> <p class="commenttext">爲什麼編輯? 「正則表達式可能都會做一半體面的工作 - 如果現有項目的一部分,你可能會留下它們。但是它們遠沒有防火,如果你從頭開始構建東西,不要使用這種方法。「大多數人會繼續使用不好的代碼,但應該鼓勵應該修改它。 – <span class="text-secondary"> <small> <a rel="noopener" target="_blank" href="https://stackoverflow.com/users/121096/">beggs</a></span> <span></span> </small> </span> </p> </div> </div> </div> </div> </div> </article> <div> <script async src="https://pagead2.googlesyndication.com/pagead/js/adsbygoogle.js"></script> <ins class="adsbygoogle" style="display:block" data-ad-client="ca-pub-6208739752673518" data-ad-slot="1038284119" data-ad-format="auto" data-full-width-responsive="true"></ins> <script> (adsbygoogle = window.adsbygoogle || []).push({}); </script> </div> <article class="board-top-1 padding-top-10"> <div class="post-col vote-info"> <span class="count">0<i class="fa fa-thumbs-up"></i></span> </div> <div class="post-offset"> <div class="answer fmt"> <p>1)匹配<code class="prettyprint-override"><title></code>和<code class="prettyprint-override"></title></code>之間的任何內容並填寫一個HTML頁面標題,因此針對<code class="prettyprint-override"><title>foo</title></code>運行結果爲<code class="prettyprint-override">foo</code>。</p> <p>2)匹配<code class="prettyprint-override">src=</code>後面的任何字符串,以<code class="prettyprint-override">png</code>,<code class="prettyprint-override">jpg</code>或<code class="prettyprint-override">gif</code>結尾。用於提取HTML代碼中圖像的URL。</p> <p>Per @ Pekka的回答:不要在真實世界的代碼中這樣做。</p> </div> <div class="post-info"> <div class="post-meta row"> <p class="text-secondary col-lg-6"> <span class="source"> <a rel="noopener" target="_blank" href="https://stackoverflow.com/q/4954963">來源</a> </span> </p> <p class="text-secondary col-lg-6"> <span class="float-right date"> <span>2011-02-10 08:46:02</span> <a rel="noopener" target="_blank" href="https://stackoverflow.com/users/121096/">beggs</a></span> </p> <p class="col-12"></p> <p class="col-12"></p></div> </div> </div> </article> </div> <div class="clearfix"> </div> <div class="relative-box"> <div class="relative">相關問題</div> <ul class="relative_list"> <li> 1. <a href="http://hk.uwenku.com/question/p-emypbpjk-og.html" target="_blank" title="JavaScript中這些正則表達式的含義是什麼?"> JavaScript中這些正則表達式的含義是什麼? </a> </li> <li> 2. <a href="http://hk.uwenku.com/question/p-qoyilxdy-nz.html" target="_blank" title="是什麼,這些正則表達式"> 是什麼,這些正則表達式 </a> </li> <li> 3. <a href="http://hk.uwenku.com/question/p-agrbvpic-bac.html" target="_blank" title="什麼是正則表達式這些"> 什麼是正則表達式這些 </a> </li> <li> 4. <a href="http://hk.uwenku.com/question/p-pbglepcn-hw.html" target="_blank" title="這個正則表達式的含義是什麼(php)"> 這個正則表達式的含義是什麼(php) </a> </li> <li> 5. <a href="http://hk.uwenku.com/question/p-dubaivcq-bdg.html" target="_blank" title="這個正則表達式的含義是什麼?"> 這個正則表達式的含義是什麼? </a> </li> <li> 6. <a href="http://hk.uwenku.com/question/p-ohsbicgk-bmg.html" target="_blank" title="在這個正則表達式中\\ +的含義是什麼?"> 在這個正則表達式中\\ +的含義是什麼? </a> </li> <li> 7. <a href="http://hk.uwenku.com/question/p-dvtrxetk-yx.html" target="_blank" title="這個正則表達式的含義是什麼?"> 這個正則表達式的含義是什麼? </a> </li> <li> 8. <a href="http://hk.uwenku.com/question/p-btgpxkay-td.html" target="_blank" title="這個正則表達式的含義是什麼?"> 這個正則表達式的含義是什麼? </a> </li> <li> 9. <a href="http://hk.uwenku.com/question/p-przqwhpz-bck.html" target="_blank" title="這個正則表達式的含義是什麼?"> 這個正則表達式的含義是什麼? </a> </li> <li> 10. <a href="http://hk.uwenku.com/question/p-xtdacxcr-kk.html" target="_blank" title="「[^]」正則表達式模式的含義是什麼(javascript正則表達式)?"> 「[^]」正則表達式模式的含義是什麼(javascript正則表達式)? </a> </li> <div> <script async src="https://pagead2.googlesyndication.com/pagead/js/adsbygoogle.js"></script> <ins class="adsbygoogle" style="display:block; text-align:center;" data-ad-layout="in-article" data-ad-format="fluid" data-ad-client="ca-pub-6208739752673518" data-ad-slot="4606349252"></ins> <script> (adsbygoogle = window.adsbygoogle || []).push({}); </script> </div> <li> 11. <a href="http://hk.uwenku.com/question/p-vuqatcdf-ne.html" target="_blank" title="這個正則表達式的含義"> 這個正則表達式的含義 </a> </li> <li> 12. <a href="http://hk.uwenku.com/question/p-ywmgvqmh-beo.html" target="_blank" title="這是什麼正則表達式?"> 這是什麼正則表達式? </a> </li> <li> 13. <a href="http://hk.uwenku.com/question/p-mxtvreoc-mx.html" target="_blank" title="Lex這是什麼正則表達式"> Lex這是什麼正則表達式 </a> </li> <li> 14. <a href="http://hk.uwenku.com/question/p-yojuviru-wd.html" target="_blank" title="這是什麼正則表達式?"> 這是什麼正則表達式? </a> </li> <li> 15. <a href="http://hk.uwenku.com/question/p-bafjrygm-bdp.html" target="_blank" title="這是什麼正則表達式?"> 這是什麼正則表達式? </a> </li> <li> 16. <a href="http://hk.uwenku.com/question/p-vmhopybb-bgn.html" target="_blank" title="這將是什麼正則表達式?"> 這將是什麼正則表達式? </a> </li> <li> 17. <a href="http://hk.uwenku.com/question/p-cpftzucj-bu.html" target="_blank" title=",這是什麼陣正則表達式"> ,這是什麼陣正則表達式 </a> </li> <li> 18. <a href="http://hk.uwenku.com/question/p-cslxfhun-bs.html" target="_blank" title="這是什麼javascript正則表達式?"> 這是什麼javascript正則表達式? </a> </li> <li> 19. <a href="http://hk.uwenku.com/question/p-nhsokpuv-ho.html" target="_blank" title="這將是什麼正則表達式"> 這將是什麼正則表達式 </a> </li> <li> 20. <a href="http://hk.uwenku.com/question/p-sgvsgawz-hd.html" target="_blank" title="這是什麼javascript正則表達式"> 這是什麼javascript正則表達式 </a> </li> <li> 21. <a href="http://hk.uwenku.com/question/p-uebkeqxh-vs.html" target="_blank" title="什麼是捕捉這些元素的正則表達式?"> 什麼是捕捉這些元素的正則表達式? </a> </li> <li> 22. <a href="http://hk.uwenku.com/question/p-wazelbvs-bay.html" target="_blank" title="什麼是MySQL的SQL正則表達式這個表達式"> 什麼是MySQL的SQL正則表達式這個表達式 </a> </li> <li> 23. <a href="http://hk.uwenku.com/question/p-rqyykybh-mc.html" target="_blank" title="正則表達式中/ gi的含義是什麼?"> 正則表達式中/ gi的含義是什麼? </a> </li> <li> 24. <a href="http://hk.uwenku.com/question/p-gdoxwsyq-zg.html" target="_blank" title="你在正則表達式中的含義是什麼?"> 你在正則表達式中的含義是什麼? </a> </li> <li> 25. <a href="http://hk.uwenku.com/question/p-vkuwtpmu-vc.html" target="_blank" title="[^。] *在正則表達式中的含義是什麼?"> [^。] *在正則表達式中的含義是什麼? </a> </li> <li> 26. <a href="http://hk.uwenku.com/question/p-wjifaplc-bny.html" target="_blank" title="反斜槓在正則表達式中的含義是什麼?"> 反斜槓在正則表達式中的含義是什麼? </a> </li> <li> 27. <a href="http://hk.uwenku.com/question/p-mnyzbzlq-dd.html" target="_blank" title="正則表達式\ S在JavaScript中的含義是什麼?"> 正則表達式\ S在JavaScript中的含義是什麼? </a> </li> <li> 28. <a href="http://hk.uwenku.com/question/p-gybkfqjs-ep.html" target="_blank" title="「[[]]」在正則表達式中的含義是什麼?"> 「[[]]」在正則表達式中的含義是什麼? </a> </li> <li> 29. <a href="http://hk.uwenku.com/question/p-xagojtnl-xb.html" target="_blank" title="perl正則表達式的含義是什麼?"> perl正則表達式的含義是什麼? </a> </li> <li> 30. <a href="http://hk.uwenku.com/question/p-mfjgdygc-bnb.html" target="_blank" title="正則表達式中'g'標誌的含義是什麼?"> 正則表達式中'g'標誌的含義是什麼? </a> </li> </ul> </div> <div> <script async src="https://pagead2.googlesyndication.com/pagead/js/adsbygoogle.js"></script> <ins class="adsbygoogle" style="display:block" data-ad-format="autorelaxed" data-ad-client="ca-pub-6208739752673518" data-ad-slot="1575177025"></ins> <script> (adsbygoogle = window.adsbygoogle || []).push({}); </script> </div> <div class="padding-top-10"></div> </div> </div> <script type="text/javascript" src="http://img.uwenku.com/uwenku/script/side.js?t=1644592048261"></script> <script type="text/javascript" src="http://img.uwenku.com/uwenku/plugin/highlight/highlight.pack.js"></script> <link href="http://img.uwenku.com/uwenku/plugin/highlight/styles/docco.css" media="screen" rel="stylesheet" type="text/css" /> <script type="text/javascript"> $('pre').each(function(i, e) { hljs.highlightBlock(e, "<span class='indent'> </span>", false) }); </script> <div class="col-lg-3 col-md-4 col-sm-5"> <div id="rightTop"> <div class="row"> <script async src="https://pagead2.googlesyndication.com/pagead/js/adsbygoogle.js"></script> <ins class="adsbygoogle" style="display:block" data-ad-client="ca-pub-6208739752673518" data-ad-slot="5415218910" data-ad-format="auto" data-full-width-responsive="true"></ins> <script> (adsbygoogle = window.adsbygoogle || []).push({}); </script> </div> <div class="row sidebar panel panel-default"> <div class="panel-heading font-bold"> 最新問題 </div> <div class="m-b-sm m-t-sm clearfix"> <ul class="side_article_list"> <li class="side_article_list_item"> 1. <a href="http://hk.uwenku.com/question/p-hyvmiqdd-bgm.html" target="_blank" title="如何在模型從數據庫更新後保持實體代碼不變?"> 如何在模型從數據庫更新後保持實體代碼不變? </a> </li> <li class="side_article_list_item"> 2. <a href="http://hk.uwenku.com/question/p-ccgjpxxv-bna.html" target="_blank" title="訪問從OpenCV的函數C++ NDK"> 訪問從OpenCV的函數C++ NDK </a> </li> <li class="side_article_list_item"> 3. <a href="http://hk.uwenku.com/question/p-himxyfwg-bmt.html" target="_blank" title="在啓動時將/etc/profile.d/中的腳本作爲根執行?"> 在啓動時將/etc/profile.d/中的腳本作爲根執行? </a> </li> <li class="side_article_list_item"> 4. <a href="http://hk.uwenku.com/question/p-cmvqqsie-bnw.html" target="_blank" title="試圖基於另一個數據透視一列"> 試圖基於另一個數據透視一列 </a> </li> <li class="side_article_list_item"> 5. <a href="http://hk.uwenku.com/question/p-ddluvwly-bnq.html" target="_blank" title="MongoDB Native Node.js問題"> MongoDB Native Node.js問題 </a> </li> <li class="side_article_list_item"> 6. <a href="http://hk.uwenku.com/question/p-vnnbjsyr-bnh.html" target="_blank" title="Tensorflow和CUDA版本"> Tensorflow和CUDA版本 </a> </li> <li class="side_article_list_item"> 7. <a href="http://hk.uwenku.com/question/p-poccepxy-bdn.html" target="_blank" title="是什麼,如果我可以通過安裝搬運工引擎"> 是什麼,如果我可以通過安裝搬運工引擎 </a> </li> <li class="side_article_list_item"> 8. <a href="http://hk.uwenku.com/question/p-dzmvluel-bhe.html" target="_blank" title="優化:值替換在數據幀wiith多個條件"> 優化:值替換在數據幀wiith多個條件 </a> </li> <li class="side_article_list_item"> 9. <a href="http://hk.uwenku.com/question/p-ozzikgly-bgy.html" target="_blank" title="RxJava而不是改造回調"> RxJava而不是改造回調 </a> </li> <li class="side_article_list_item"> 10. <a href="http://hk.uwenku.com/question/p-bogienfk-bhu.html" target="_blank" title="如何將php關聯數組排序爲特定順序?"> 如何將php關聯數組排序爲特定順序? </a> </li> </ul> </div> </div> </div> <p class="article-nav-bar"></p> <div class="row sidebar article-nav"> <div class="row box_white visible-sm visible-md visible-lg margin-zero"> <div class="top"> <h3 class="title"><i class="glyphicon glyphicon-th-list"></i> 相關問題</h3> </div> <div class="article-relative-content"> <ul class="side_article_list"> <li class="side_article_list_item"> 1. <a href="http://hk.uwenku.com/question/p-emypbpjk-og.html" target="_blank" title="JavaScript中這些正則表達式的含義是什麼?"> JavaScript中這些正則表達式的含義是什麼? </a> </li> <li class="side_article_list_item"> 2. <a href="http://hk.uwenku.com/question/p-qoyilxdy-nz.html" target="_blank" title="是什麼,這些正則表達式"> 是什麼,這些正則表達式 </a> </li> <li class="side_article_list_item"> 3. <a href="http://hk.uwenku.com/question/p-agrbvpic-bac.html" target="_blank" title="什麼是正則表達式這些"> 什麼是正則表達式這些 </a> </li> <li class="side_article_list_item"> 4. <a href="http://hk.uwenku.com/question/p-pbglepcn-hw.html" target="_blank" title="這個正則表達式的含義是什麼(php)"> 這個正則表達式的含義是什麼(php) </a> </li> <li class="side_article_list_item"> 5. <a href="http://hk.uwenku.com/question/p-dubaivcq-bdg.html" target="_blank" title="這個正則表達式的含義是什麼?"> 這個正則表達式的含義是什麼? </a> </li> <li class="side_article_list_item"> 6. <a href="http://hk.uwenku.com/question/p-ohsbicgk-bmg.html" target="_blank" title="在這個正則表達式中\\ +的含義是什麼?"> 在這個正則表達式中\\ +的含義是什麼? </a> </li> <li class="side_article_list_item"> 7. <a href="http://hk.uwenku.com/question/p-dvtrxetk-yx.html" target="_blank" title="這個正則表達式的含義是什麼?"> 這個正則表達式的含義是什麼? </a> </li> <li class="side_article_list_item"> 8. <a href="http://hk.uwenku.com/question/p-btgpxkay-td.html" target="_blank" title="這個正則表達式的含義是什麼?"> 這個正則表達式的含義是什麼? </a> </li> <li class="side_article_list_item"> 9. <a href="http://hk.uwenku.com/question/p-przqwhpz-bck.html" target="_blank" title="這個正則表達式的含義是什麼?"> 這個正則表達式的含義是什麼? </a> </li> <li class="side_article_list_item"> 10. <a href="http://hk.uwenku.com/question/p-xtdacxcr-kk.html" target="_blank" title="「[^]」正則表達式模式的含義是什麼(javascript正則表達式)?"> 「[^]」正則表達式模式的含義是什麼(javascript正則表達式)? </a> </li> </ul> </div> </div> </div> </div> </div> </div> </div><!-- wrap end--> <!-- footer --> <footer id="footer"> <div class="bg-simple lt"> <div class="container"> <div class="row padder-v m-t"> <div class="col-xs-8"> <ul class="list-inline"> <li><a href="http://hk.uwenku.com/contact">聯系我們</a></li> <li>© 2020 HK.UWENKU.COM</li> <li><a target="_blank" href="https://beian.miit.gov.cn/">沪ICP备13005482号-4</a></li> <li><script type="text/javascript" src="https://v1.cnzz.com/z_stat.php?id=1280101193&web_id=1280101193"></script></li> <li><a href="http://www.uwenku.com/" target="_blank" title="优文库">简体中文</a></li> <li><a href="http://hk.uwenku.com/" target="_blank" title="優文庫">繁體中文</a></li> <li><a href="http://ru.uwenku.com/" target="_blank" title="поле вопросов и ответов">Русский</a></li> <li><a href="http://de.uwenku.com/" target="_blank" title="Frage - und - antwort - Park">Deutsch</a></li> <li><a href="http://es.uwenku.com/" target="_blank" title="Preguntas y respuestas">Español</a></li> <li><a href="http://hi.uwenku.com/" target="_blank" title="कार्यक्रम प्रश्न और उत्तर पार्क">हिन्दी</a></li> <li><a href="http://it.uwenku.com/" target="_blank" title="IL Programma di chiedere Park">Italiano</a></li> <li><a href="http://ja.uwenku.com/" target="_blank" title="プログラム問答園区">日本語</a></li> <li><a href="http://ko.uwenku.com/" target="_blank" title="프로그램 문답 단지">한국어</a></li> <li><a href="http://pl.uwenku.com/" target="_blank" title="program o park">Polski</a></li> <li><a href="http://tr.uwenku.com/" target="_blank" title="Program soru ve cevap parkı">Türkçe</a></li> <li><a href="http://vi.uwenku.com/" target="_blank" title="Đáp ứng viên">Tiếng Việt</a></li> <li><a href="http://fr.uwenku.com/" target="_blank" title="Programme interrogation Park">Française</a></li> </ul> </div> </div> </div> </div> </div> </footer> <!-- / footer --> <script> var _hmt = _hmt || []; (function() { var hm = document.createElement("script"); hm.src = "https://hm.baidu.com/hm.js?f78a970f17b19a79fc477a3378096f29"; var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(hm, s); })(); </script> </body> </html>