2010-07-02 61 views
1

我想解析XML文件,更改一些屬性並將結果寫入新的XML文件。 給定的XML文件非常大(約2 GB)。處理生物XML文檔

有沒有人有使用Ruby處理這種XML文件的經驗,並可以推薦我一個庫?

問候

+0

遠離它:-) – brainfck 2010-07-02 11:47:16

回答

1

首先,我假設你正在談論在一堆元素的改變某些屬性。這就是說,你不想一次讀取整個文檔(基於DOM的解析),你真的想要處理元素,就像你看到它們一樣(基於SAX的解析)。我不是一個紅寶石般的人,但是快速搜索發現了一些有關Ruby中SAX解析的良好信息,特別是這篇文章http://lucaguidi.com/2008/01/30/ruby-xml-parsing-with-sax

如果您只有少數幾個元素的屬性,那麼我會推薦一種不同的方法。首先,如果您可以指定要作爲正則表達式進行更改的項目,使用像sed這樣的命令行工具來編輯文件可能會更簡單。

+0

Jep,你說得對。我想刪除一些屬性以減少xml文件中給出的信息。感謝您的鏈接,它看起來很有趣,我會看看它! – brainfck 2010-07-02 11:45:34