0
我可以使用Xpath或CSS。如何僅選擇在h4標籤後面出現的p標籤 - 但不是Nokogiri的兒童?
我想:
my_page.xpath('//h4/p')
,但似乎看起來只是p
標記,是h4
孩子。
的HTML結構我解析如下所示:
<h4 class="ban">Mon May 28</h4>
<p><a href="http://phoenix.craigslist.org/cph/cpg/3043067349.html">.Net/Java Developers</a> - <font size="-1"> (phoenix)</font></p>
<p><a href="http://phoenix.craigslist.org/cph/cpg/3043066699.html">QA and Business Analysts</a> - <font size="-1"> (Phoenix Metro)</font></p>
有頁面上的其他p
& a
元素......但基本上是我想要做的就是單詞的h4
標籤與關聯以內在頁面上出現的鏈接(不嵌套在該頁面中)。
謝謝。
完美,有效。謝謝!順便說一下,w3文檔xpath的鏈接是什麼? – marcamillion
http://www.w3.org/TR/xpath20/ – Stefan