簡單解析紅寶石

可能重複：
Method to parse HTML document in Ruby?簡單解析紅寶石

如果在不同的結果，我有：

<html><head><meta http-equiv="Content-Type" content="text/html; charset=utf-8"/><link    rel="stylesheet" type="text/css" href="http://2.ai/styles/hello.css" media="screen"/><title>Welcome to Dotgeek.org * 1.ai</title></head><body>..... etc

如何可以解析，如果可能的話，而無需使用任何寶石，我現在在結果變量中的那個HTML頁面的標題？

來源

2012-09-07 devnull

注意：如果這是「一般用途」（即可以期望任何有效的HTML），您應該真的是真的使用HTML解析器，而不是正則表達式或任何其他不涉及重新創建的技巧DOM – Earlz

爲什麼不使用寶石？ Nokogiri做了精確解析HTML的簡短工作，並且是推薦的方法。否則，請查看Ruby附帶的[ReXML]（http://ruby-doc.org/stdlib/libdoc/rexml/rdoc/）。 –

是的..'Nokogiri.HTML（content）.at（'title'）。text＃=>「歡迎來到Dotgeek.org * 1.ai」' –

html = '<html><head><meta http-equiv="Content-Type" content="text/html; charset=utf-8"/><link rel="stylesheet" type="text/css" href="http://2.ai/styles/hello.css" media="screen"/><title>Welcome to Dotgeek.org * 1.ai</title></head>' 
html.match(/<title>(.*)<\/title>/)[1] #=> "Welcome to Dotgeek.org * 1.ai"

來源

2012-09-07 13:41:14

用正則表達式解析HTML的強制性鏈接：http://stackoverflow.com/a/1732454/908515 –

對不起，我不明白。該鏈接的帖子「解釋」爲什麼通常應該避免使用正則表達式解析HTML。所以，我發佈了它（儘管我承認在給定正則表達式的情況下可能是合適的）。上面的Earlz的評論更聰明，但指向相同的方向。 –

當然，我沒有說你的建議是錯誤的。但我們不知道具體問題。也許它是具有公共Web界面的關鍵任務軟件。所以devnull應該意識到這些限制。 –

你可以簡單地通過標題標籤分裂這樣的：

title = result.split(/<title>/,2)[1].split(/<\/title>/,2)[0]

（編輯：比我從Python中和不計的數量分裂的第二個參數不同工作拆分，但結果數組中的元素數，意思是split(/pattern/, 1)實際上不會分割任何東西......）

來源

2012-09-07 13:44:42 l4mpi

你好，這似乎也工作，但我有一個網站似乎使用另一種語言的標題問題看curl =％x（捲曲http://zales.1.ai）猿猴= curl.match（/ （*）<\/title> /）[1]提出猿猴拋出'<main> '：未定義的方法'[]' 爲零：NilClass（NoMethodError） – <span class="text-secondary"> <small> <a rel="noopener" target="_blank" href="https://stackoverflow.com/users/1318313/">devnull</a></span> <span></span> </small> </span> </p> </div> </div> </div> <div itemprop="comment" class="post-comment"> <div class="row"> <div class="col-lg-1"><span class="text-secondary">+0</span></div> <div class="col-lg-11"> <p class="commenttext">到'呼叫match'返回nil因爲它無法找到模式，並試圖在nil上使用'[]'會導致此錯誤（請參閱http://stackoverflow.com/questions/3835428/what-do-an-undefined-method-mean-in -rails）。您鏈接到的頁面不包含'<title>'標籤（實際上，這是其完整源代碼：'<h1>Ahoj svete :)</h1>'），因此您無法匹配它。 – <span class="text-secondary"> <small> <a rel="noopener" target="_blank" href="https://stackoverflow.com/users/1110381/">l4mpi</a></span> <span></span> </small> </span> </p> </div> </div> </div> </div> </div> </article> </div> <div class="clearfix"> </div> <div class="relative-box"> <div class="relative">相關問題</div> <ul class="relative_list"> <li> 1. <a href="http://hk.uwenku.com/question/p-pzbedyjj-bgv.html" target="_blank" title="解析紅寶石"> 解析紅寶石 </a> </li> <li> 2. <a href="http://hk.uwenku.com/question/p-ntdjxaad-mt.html" target="_blank" title="解析紅寶石"> 解析紅寶石 </a> </li> <li> 3. <a href="http://hk.uwenku.com/question/p-smycmvnq-bad.html" target="_blank" title="解析紅寶石代碼"> 解析紅寶石代碼 </a> </li> <li> 4. <a href="http://hk.uwenku.com/question/p-nhzoxqxh-bkc.html" target="_blank" title="紅寶石Nokogiri Javascript解析"> 紅寶石Nokogiri Javascript解析 </a> </li> <li> 5. <a href="http://hk.uwenku.com/question/p-dvivwjeo-zt.html" target="_blank" title="JS解析紅寶石"> JS解析紅寶石 </a> </li> <li> 6. <a href="http://hk.uwenku.com/question/p-mglwhxse-ru.html" target="_blank" title="解析在紅寶石"> 解析在紅寶石 </a> </li> <li> 7. <a href="http://hk.uwenku.com/question/p-xbzyyele-bgn.html" target="_blank" title="時間解析紅寶石"> 時間解析紅寶石 </a> </li> <li> 8. <a href="http://hk.uwenku.com/question/p-twrmrhkj-bhs.html" target="_blank" title="解析文件紅寶石"> 解析文件紅寶石 </a> </li> <li> 9. <a href="http://hk.uwenku.com/question/p-dgwawbyn-ot.html" target="_blank" title="紅寶石XML解析"> 紅寶石XML解析 </a> </li> <li> 10. <a href="http://hk.uwenku.com/question/p-gsyepsmw-pb.html" target="_blank" title="解析像紅寶石"> 解析像紅寶石 </a> </li> <div> <script async src="https://pagead2.googlesyndication.com/pagead/js/adsbygoogle.js"></script> <ins class="adsbygoogle" style="display:block; text-align:center;" data-ad-layout="in-article" data-ad-format="fluid" data-ad-client="ca-pub-6208739752673518" data-ad-slot="4606349252"></ins> <script> (adsbygoogle = window.adsbygoogle || []).push({}); </script> </div> <li> 11. <a href="http://hk.uwenku.com/question/p-zplxmoed-we.html" target="_blank" title="紅寶石解析錯誤"> 紅寶石解析錯誤 </a> </li> <li> 12. <a href="http://hk.uwenku.com/question/p-mjmckvba-yb.html" target="_blank" title="解析JSON紅寶石"> 解析JSON紅寶石 </a> </li> <li> 13. <a href="http://hk.uwenku.com/question/p-dbhzeihh-bmr.html" target="_blank" title="解析的dmidecode紅寶石"> 解析的dmidecode紅寶石 </a> </li> <li> 14. <a href="http://hk.uwenku.com/question/p-wakyfwuc-wa.html" target="_blank" title="紅寶石浮子解析"> 紅寶石浮子解析 </a> </li> <li> 15. <a href="http://hk.uwenku.com/question/p-mbuukmvh-mn.html" target="_blank" title="紅寶石簡單替換"> 紅寶石簡單替換 </a> </li> <li> 16. <a href="http://hk.uwenku.com/question/p-yqbkplil-hq.html" target="_blank" title="紅寶石nokogiri解析解析"> 紅寶石nokogiri解析解析 </a> </li> <li> 17. <a href="http://hk.uwenku.com/question/p-nbdyjaou-ev.html" target="_blank" title="非常簡單的紅寶石組合框 - 文本解析prolem"> 非常簡單的紅寶石組合框 - 文本解析prolem </a> </li> <li> 18. <a href="http://hk.uwenku.com/question/p-bgkwbqzk-pa.html" target="_blank" title="紅寶石：解析CSV數據到PDF"> 紅寶石：解析CSV數據到PDF </a> </li> <li> 19. <a href="http://hk.uwenku.com/question/p-dpfjjzlt-tt.html" target="_blank" title="解析日期/時間紅寶石"> 解析日期/時間紅寶石 </a> </li> <li> 20. <a href="http://hk.uwenku.com/question/p-pantazhp-bex.html" target="_blank" title="使用紅寶石解析LESS"> 使用紅寶石解析LESS </a> </li> <li> 21. <a href="http://hk.uwenku.com/question/p-phtjmltz-kw.html" target="_blank" title="紅寶石：解析複雜的哈希"> 紅寶石：解析複雜的哈希 </a> </li> <li> 22. <a href="http://hk.uwenku.com/question/p-qtsylkoi-ys.html" target="_blank" title="紅寶石：XML到JSON樹解析"> 紅寶石：XML到JSON樹解析 </a> </li> <li> 23. <a href="http://hk.uwenku.com/question/p-sgwjrvmg-us.html" target="_blank" title="紅寶石：解析API響應"> 紅寶石：解析API響應 </a> </li> <li> 24. <a href="http://hk.uwenku.com/question/p-qlbqhurx-hx.html" target="_blank" title="紅寶石 - FasterCSV後解析JSON"> 紅寶石 - FasterCSV後解析JSON </a> </li> <li> 25. <a href="http://hk.uwenku.com/question/p-spjtyfpt-kh.html" target="_blank" title="JSON解析紅寶石問題"> JSON解析紅寶石問題 </a> </li> <li> 26. <a href="http://hk.uwenku.com/question/p-ywaxzgfp-yt.html" target="_blank" title="紅寶石/日期解析小時"> 紅寶石/日期解析小時 </a> </li> <li> 27. <a href="http://hk.uwenku.com/question/p-wgulduzz-bkp.html" target="_blank" title="問題與紅寶石解析"> 問題與紅寶石解析 </a> </li> <li> 28. <a href="http://hk.uwenku.com/question/p-wvfyolai-bq.html" target="_blank" title="解析紅寶石文件引用"> 解析紅寶石文件引用 </a> </li> <li> 29. <a href="http://hk.uwenku.com/question/p-vcwnfwdr-s.html" target="_blank" title="紅寶石解析JSON括號"> 紅寶石解析JSON括號 </a> </li> <li> 30. <a href="http://hk.uwenku.com/question/p-ywovyduy-st.html" target="_blank" title="解析JSON反對紅寶石"> 解析JSON反對紅寶石 </a> </li> </ul> </div> <div> <script async src="https://pagead2.googlesyndication.com/pagead/js/adsbygoogle.js"></script> <ins class="adsbygoogle" style="display:block" data-ad-format="autorelaxed" data-ad-client="ca-pub-6208739752673518" data-ad-slot="1575177025"></ins> <script> (adsbygoogle = window.adsbygoogle || []).push({}); </script> </div> <div class="padding-top-10"></div> </div> </div> <script type="text/javascript" src="http://img.uwenku.com/uwenku/script/side.js?t=1644592048261"></script> <script type="text/javascript" src="http://img.uwenku.com/uwenku/plugin/highlight/highlight.pack.js"></script> <link href="http://img.uwenku.com/uwenku/plugin/highlight/styles/docco.css" media="screen" rel="stylesheet" type="text/css" /> <script type="text/javascript"> $('pre').each(function(i, e) { hljs.highlightBlock(e, "<span class='indent'> </span>", false) }); </script> <div class="col-lg-3 col-md-4 col-sm-5"> <div id="rightTop"> <div class="row"> <script async src="https://pagead2.googlesyndication.com/pagead/js/adsbygoogle.js"></script> <ins class="adsbygoogle" style="display:block" data-ad-client="ca-pub-6208739752673518" data-ad-slot="5415218910" data-ad-format="auto" data-full-width-responsive="true"></ins> <script> (adsbygoogle = window.adsbygoogle || []).push({}); </script> </div> <div class="row sidebar panel panel-default"> <div class="panel-heading font-bold"> 最新問題 </div> <div class="m-b-sm m-t-sm clearfix"> <ul class="side_article_list"> <li class="side_article_list_item"> 1. <a href="http://hk.uwenku.com/question/p-zhhzbiyh-bho.html" target="_blank" title="如何在單線程中執行一些Clojure期貨？"> 如何在單線程中執行一些Clojure期貨？ </a> </li> <li class="side_article_list_item"> 2. <a href="http://hk.uwenku.com/question/p-wuzqwgso-bkk.html" target="_blank" title="jQuery的onclick事件鼠標滾動"> jQuery的onclick事件鼠標滾動 </a> </li> <li class="side_article_list_item"> 3. <a href="http://hk.uwenku.com/question/p-ziaqphqw-bkx.html" target="_blank" title="網頁API鏈（所代理人中）"> 網頁API鏈（所代理人中） </a> </li> <li class="side_article_list_item"> 4. <a href="http://hk.uwenku.com/question/p-svzcmvew-bak.html" target="_blank" title="ocamlfind的編譯失敗「install -m 0755 ocaml-stub"> ocamlfind的編譯失敗「install -m 0755 ocaml-stub </a> </li> <li class="side_article_list_item"> 5. <a href="http://hk.uwenku.com/question/p-bgtothrv-bch.html" target="_blank" title="的Rails 5.1 button_to幫手產生的查詢字符串，而不是隱藏表單"> 的Rails 5.1 button_to幫手產生的查詢字符串，而不是隱藏表單 </a> </li> <li class="side_article_list_item"> 6. <a href="http://hk.uwenku.com/question/p-cwalneyp-bca.html" target="_blank" title="斯卡拉隱式轉換爲有效宏內的一元值"> 斯卡拉隱式轉換爲有效宏內的一元值 </a> </li> <li class="side_article_list_item"> 7. <a href="http://hk.uwenku.com/question/p-ccaekeuf-bbu.html" target="_blank" title="Swift 4和Firebase中的信號量建議"> Swift 4和Firebase中的信號量建議 </a> </li> <li class="side_article_list_item"> 8. <a href="http://hk.uwenku.com/question/p-xtbqlwxt-bbo.html" target="_blank" title="如何在應用程序啓動期間獲取位置"> 如何在應用程序啓動期間獲取位置 </a> </li> <li class="side_article_list_item"> 9. <a href="http://hk.uwenku.com/question/p-rrljdjfg-bbd.html" target="_blank" title="什麼讓使用PHP的preg_match"> 什麼讓使用PHP的preg_match </a> </li> <li class="side_article_list_item"> 10. <a href="http://hk.uwenku.com/question/p-hrplwpim-bax.html" target="_blank" title="你好我正在使用離子科爾多瓦"> 你好我正在使用離子科爾多瓦 </a> </li> </ul> </div> </div> </div> <p class="article-nav-bar"></p> <div class="row sidebar article-nav"> <div class="row box_white visible-sm visible-md visible-lg margin-zero"> <div class="top"> <h3 class="title"><i class="glyphicon glyphicon-th-list"></i> 相關問題</h3> </div> <div class="article-relative-content"> <ul class="side_article_list"> <li class="side_article_list_item"> 1. <a href="http://hk.uwenku.com/question/p-pzbedyjj-bgv.html" target="_blank" title="解析紅寶石"> 解析紅寶石 </a> </li> <li class="side_article_list_item"> 2. <a href="http://hk.uwenku.com/question/p-ntdjxaad-mt.html" target="_blank" title="解析紅寶石"> 解析紅寶石 </a> </li> <li class="side_article_list_item"> 3. <a href="http://hk.uwenku.com/question/p-smycmvnq-bad.html" target="_blank" title="解析紅寶石代碼"> 解析紅寶石代碼 </a> </li> <li class="side_article_list_item"> 4. <a href="http://hk.uwenku.com/question/p-nhzoxqxh-bkc.html" target="_blank" title="紅寶石Nokogiri Javascript解析"> 紅寶石Nokogiri Javascript解析 </a> </li> <li class="side_article_list_item"> 5. <a href="http://hk.uwenku.com/question/p-dvivwjeo-zt.html" target="_blank" title="JS解析紅寶石"> JS解析紅寶石 </a> </li> <li class="side_article_list_item"> 6. <a href="http://hk.uwenku.com/question/p-mglwhxse-ru.html" target="_blank" title="解析在紅寶石"> 解析在紅寶石 </a> </li> <li class="side_article_list_item"> 7. <a href="http://hk.uwenku.com/question/p-xbzyyele-bgn.html" target="_blank" title="時間解析紅寶石"> 時間解析紅寶石 </a> </li> <li class="side_article_list_item"> 8. <a href="http://hk.uwenku.com/question/p-twrmrhkj-bhs.html" target="_blank" title="解析文件紅寶石"> 解析文件紅寶石 </a> </li> <li class="side_article_list_item"> 9. <a href="http://hk.uwenku.com/question/p-dgwawbyn-ot.html" target="_blank" title="紅寶石XML解析"> 紅寶石XML解析 </a> </li> <li class="side_article_list_item"> 10. <a href="http://hk.uwenku.com/question/p-gsyepsmw-pb.html" target="_blank" title="解析像紅寶石"> 解析像紅寶石 </a> </li> </ul> </div> </div> </div> </div> </div> </div> </div>  <footer id="footer"> <div class="bg-simple lt"> <div class="container"> <div class="row padder-v m-t"> <div class="col-xs-8"> <ul class="list-inline"> <li><a href="http://hk.uwenku.com/contact">聯系我們</a></li> <li>© 2020 HK.UWENKU.COM</li> <li><a target="_blank" href="https://beian.miit.gov.cn/">沪ICP备13005482号-4</a></li> <li><script type="text/javascript" src="https://v1.cnzz.com/z_stat.php?id=1280101193&web_id=1280101193"></script></li> <li><a href="http://www.uwenku.com/" target="_blank" title="优文库">简体中文</a></li> <li><a href="http://hk.uwenku.com/" target="_blank" title="優文庫">繁體中文</a></li> <li><a href="http://ru.uwenku.com/" target="_blank" title="поле вопросов и ответов">Русский</a></li> <li><a href="http://de.uwenku.com/" target="_blank" title="Frage - und - antwort - Park">Deutsch</a></li> <li><a href="http://es.uwenku.com/" target="_blank" title="Preguntas y respuestas">Español</a></li> <li><a href="http://hi.uwenku.com/" target="_blank" title="कार्यक्रम प्रश्न और उत्तर पार्क">हिन्दी</a></li> <li><a href="http://it.uwenku.com/" target="_blank" title="IL Programma di chiedere Park">Italiano</a></li> <li><a href="http://ja.uwenku.com/" target="_blank" title="プログラム問答園区">日本語</a></li> <li><a href="http://ko.uwenku.com/" target="_blank" title="프로그램 문답 단지">한국어</a></li> <li><a href="http://pl.uwenku.com/" target="_blank" title="program o park">Polski</a></li> <li><a href="http://tr.uwenku.com/" target="_blank" title="Program soru ve cevap parkı">Türkçe</a></li> <li><a href="http://vi.uwenku.com/" target="_blank" title="Đáp ứng viên">Tiếng Việt</a></li> <li><a href="http://fr.uwenku.com/" target="_blank" title="Programme interrogation Park">Française</a></li> </ul> </div> </div> </div> </div> </div> </footer>  <script> var _hmt = _hmt || []; (function() { var hm = document.createElement("script"); hm.src = "https://hm.baidu.com/hm.js?f78a970f17b19a79fc477a3378096f29"; var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(hm, s); })(); </script> </body> </html>

簡單解析紅寶石

回答