0
使用杏,很容易看到如何使用CSS選擇器提取給定ID或類的所有元素。根據這些元素的某些屬性是否與某些正則表達式匹配,是否可以從文檔中提取元素?在Hpricot中匹配id和正則表達式的最佳方式是什麼?
使用杏,很容易看到如何使用CSS選擇器提取給定ID或類的所有元素。根據這些元素的某些屬性是否與某些正則表達式匹配,是否可以從文檔中提取元素?在Hpricot中匹配id和正則表達式的最佳方式是什麼?
如果你的意思做這樣的事情:
doc.search("//div[@id=/regex/]")
話,我不認爲這是可以做到。另一種方法是查找所有元素,然後遍歷結果,刪除那些不匹配正則表達式的結果。
result = doc.search("//div")
result.delete_if (|x| x.to_s !~ /regex/)
有很多的替代方法。此主題有兩個其他建議:Hpricot and Regular Expression。
注意,這取決於它到底是什麼,你要匹配你可以使用「支持的,但不同的」語法可在Hpricot Wiki,如:
E[@foo$=「bar」]
匹配的E元素的「foo」 屬性值完全以 字符串「bar」結尾