2013-04-03 26 views
2

我想獲取某個HTML標記中的文本。它看起來像:如何獲取HTML標籤中的文本?

<div id="data123">data1: value1<br>data2: value2<br> data3: value</div> 

我的代碼如下所示:

html_page = Nokogiri::HTML open 'my_url' 
who_is_raw = html_page.css('div#data123')[0] #.text 

我得到要麼<div>標籤內的文本沒有<br>標籤或整個<div>所有<br>內。但是,我只想要其中的<div>標記和<br>標記內的文本。

我該怎麼做?

回答