我有一個文檔,想要提取一些元素,這些元素是父元素的直接後代,但省略了其他元素。 問題是我沒有按照它們在文檔中出現的順序獲取元素。 原因可能實際上是我使用的CSS選擇器是錯誤的......按照它們在文檔中出現的順序獲取元素
require 'rubygems'
require 'nokogiri'
require 'open-uri'
html = <<END
<content>
<p>Lorem</p>
<div>
FOO
<p>BAR</p>
</div>
<h1>Ipsum</h1>
<p>Dolor</p>
<div>
BAR
<h2>FOO</h2>
</div>
<h2>Sit</h2>
<p>Amet</p>
</html>
END
Nokogiri::HTML(html).css('content > p, content > h1, content > h2').inner_html # "<p>Lorem</p><p>Dolor</p><p>Amet</p><h1>Ipsum</h1><h2>Sit</h2>"
我要的是
<p>Lorem</p><h1>Ipsum</h1><p>Dolor</p><h2>Sit</h2><p>Amet</p>
完美,謝謝! – 2009-09-18 21:50:28