我通常使用大型XML文件,並且通常通過grep
進行字數統計以確認某些統計信息。sed單行 - 查找分隔符對周圍的關鍵字
例如,我要確保我通過有widget
至少五個實例在一個XML文件:
cat test.xml | grep -ic widget
此外,我只是想能夠登錄該行widget
出現在,即:
cat test.xml | grep -i widget > ~/log.txt
不過,我真正需要的關鍵信息的XML代碼widget
出現在塊示例文件可能看起來像:
<test> blah blah
blah blah blah
widget
blah blah blah
</test>
<formula>
blah
<details>
widget
</details>
</formula>
我試圖讓從以上示例文本下面的輸出,即:
<test>widget</test>
<formula>widget</formula>
實際上,我試圖讓使用標記的最高水平,適用於一個單一的線包含任意字符串的XML文本/代碼塊,widget
。
有沒有人有任何建議通過命令行一個班輪來實現這一點?
謝謝。
看看[此帖](http://stackoverflow.com /問題/ 2222150 /提取數據的- - 從-A-簡單的XML文件)。也許你有一些想法。 – mtk 2012-07-20 23:19:42