我嘗試提取上表中列出的所有五行。
我正在使用Ruby hpricot庫來使用xpath表達式提取錶行。
在我的例子中,我使用的xpath表達式是/ html/body/center/table/tr。請注意,我已經從表達式中移除了tbody標記,這通常是成功提取的情況。
奇怪的是,我得到結果中的前三行,最後兩行丟失。我不知道那裏發生了什麼。
編輯:沒有什麼關於代碼的魔力,只要附上請求。
require 'open-uri'
require 'hpricot'
faculty = Hpricot(open("http://www.utm.utoronto.ca/7800.0.html"))
(faculty/"/html/body/center/table/tr").each do |text|
puts text.to_s
end
我們可以看到你的代碼嗎? –
@JoshuaClark先生,先生。 –