我以前用xmlstartlet來處理XML文件。您可以給它一個簡單的comannd行,它會生成(內部)XSLT模板並將其應用於XML文件。真的很簡單的命令行用於XML文件的SAX解析器
但是現在我有一個很大的XML文件,所以我真的需要爲此使用SAX,而不是XSLT。而不是編寫一個簡單的程序來做到這一點,我想知道是否有一個更簡單的方法,從命令行有一個非常簡單的SAX解析器。你可以給它一些選擇,它會沿着你的XML文件傳播,並從中打印出一些結構化的數據。
我以前用xmlstartlet來處理XML文件。您可以給它一個簡單的comannd行,它會生成(內部)XSLT模板並將其應用於XML文件。真的很簡單的命令行用於XML文件的SAX解析器
但是現在我有一個很大的XML文件,所以我真的需要爲此使用SAX,而不是XSLT。而不是編寫一個簡單的程序來做到這一點,我想知道是否有一個更簡單的方法,從命令行有一個非常簡單的SAX解析器。你可以給它一些選擇,它會沿着你的XML文件傳播,並從中打印出一些結構化的數據。
下載Python並在交互式命令行模式下運行它。
不知道你想要什麼,提取和(與薩克斯你需要做對自己的一切原因)如何 - 「配置」等是相當複雜因此沒有命令行工具,只有編程語言可以讓你做sax。
你的xml有多大?也許http://ofb.net/~egnor/xml2/能幫助(也取決於你的XML的大小。
同樣,我有1.1G的XML文件。
使用xsltproc的接管內存6G,但完成。
我也試圖撒克遜但它運行的內存和失敗。
Exception in thread "main" java.lang.OutOfMemoryError: Java heap space
最後,我們跟着danglund的建議和使用Python和ATM。