2010-10-09 19 views
0

我正在尋找解析一些老的HTML,有很多可以用CSS完成的無關標籤 - <b>,<font>等。我使用Hpricot來解析它,但我想獲得最內層的「inner_html」 - 如何用Hpricot做到這一點?例如,假設我用戶Hpricot抓取了所有我通過循環獲取行和單元格的元素,但我想要獲取單元格內的數據,但它們沒有其他標籤或諸如<b><font ...>1,000</font></b>之類的東西 - 是否存在欺騙只得到「1000」?用Hpricot&Ruby解析HTML - 獲取最內層的html?

感謝,

回答

1

我不知道這是否是完全你想要什麼,但你可能想看看inner_text方法。它將返回與inner_html相同的內容,但所有HTML元素都將被刪除。