0
行我需要解析的HTML表這樣的格式:引入nokogiri:解析HTML表的沒有開放標籤
require 'nokogiri'
html_table = '<table>
<tbody>
<tr>
<td>Some text in the first row!</td>
<td>More text in the first row!</td>
</tr>
<td>Some text in the second row!</td>
<td>More text in the second row!</td> </tr>
<td>Some text in the third row!</td>
<td>More text in the third row!</td> </tr>
</tbody>
</table>'
正如你所看到的,最後兩行沒有開<tr>
標籤。當我試圖讓使用puts Nokogiri::HTML(html_table).css('table tr')
所有三排,代碼清理和最後兩行成爲td
節點:
<tr>
<td>Some text in the first row!</td>
<td>More text in the first row!</td>
</tr>
我已經在網絡上找到一些方法來解決這個問題的時候沒有關閉標籤</tr>
,但不是相反。 有沒有簡單的方法來解決這個使用Nokogiri?
它完美的作品!沒有必要使用源代碼,因爲使用錯誤的代碼就足夠了。我不得不說,我在Linux上試過這個,因爲Windows上的gem安裝會引發錯誤。 – 2014-09-30 22:40:02