在Hpricot中匹配id和正則表達式的最佳方式是什麼？

使用杏，很容易看到如何使用CSS選擇器提取給定ID或類的所有元素。根據這些元素的某些屬性是否與某些正則表達式匹配，是否可以從文檔中提取元素？在Hpricot中匹配id和正則表達式的最佳方式是什麼？

2009-12-01 Paul Wicks

如果你的意思做這樣的事情：

doc.search("//div[@id=/regex/]")

話，我不認爲這是可以做到。另一種方法是查找所有元素，然後遍歷結果，刪除那些不匹配正則表達式的結果。

result = doc.search("//div") 
result.delete_if (|x| x.to_s !~ /regex/)

有很多的替代方法。此主題有兩個其他建議：Hpricot and Regular Expression。

注意，這取決於它到底是什麼，你要匹配你可以使用「支持的，但不同的」語法可在Hpricot Wiki，如：

E[@foo$=「bar」]

匹配的E元素的「foo」屬性值完全以字符串「bar」結尾

2009-12-02 14:51:18 atomicules

回答