2013-06-05 66 views
1

我試圖提取一段嵌入在html代碼<span class="code"></span>之間的文本。這個想法是,我需要在這些信息之間存儲的信息。從html源代碼中提取文本/數據

如何從網頁中自動提取該信息?

+0

你用什麼語言解析它? JavaScript的?紅寶石?請更具體一些。 – Piccolo

+0

幾乎所有語言都提供此功能 – doniyor

+1

例如,[使用Python和BeautifulSoup](http://stackoverflow.com/questions/7080506/how-to-parse-a-html-file-and-get-the-text-你可能會得到:'打印湯('span',class ='code')。text' – marlenunez

回答

0

我打算假設你是用Ruby或Javascript做的,因爲你沒有指定,而且這些都是我知道如何最好的語言。

在Ruby中,你會先安裝Nokogiri gem通過

gem install nokogiri 

而且你的代碼會是這個樣子:

require 'nokogiri' 
require 'open-uri' 

doc = Nokogiri::HTML(open('http://your-url.example.com/foo/bar)) 
value = doc.css('span.code'); 

p value 

對於JavaScript,你可以使用jQuery(不真的很確定如何做到這一點)。

var value = $('span.code').value;