我有一個大的文件無法打開:提取屬性和數據與引入nokogiri
... more here
<my_element attr1='123'>
... a lot of text and elements here
</my_element>
<my_element attr1='33'>
... a lot of text and elements here
</my_element>
... more here
更新:
我試圖this:
#!/usr/bin/ruby
require "rubygems"
require "nokogiri"
require "debugger"
require "awesome_print"
file = ARGV[0]
reader = Nokogiri::XML::Reader(File.open(file))
reader.each do |node|
if node.name == "PATDOC"
debugger
break
end
end
但node.attributes
回報{}
,如何我可以從元素中提取屬性和內部文本嗎?
改爲使用XML解析器。它會讓你的生活更輕鬆。 – squiguy 2013-03-08 17:05:56
我有一個很長的文件,我甚至無法打開,我可以使用哪個解析器?我在OS X – juanpastas 2013-03-08 17:09:50
定義「大」和「長」。大約60 MB壓縮的 – 2013-03-10 16:49:58