2013-05-09 22 views
0

我有一個大的TEXT(XML?)轉儲,我只想拿出包含我的內容的行。抓取TEXT塊中的特定行

例如,我希望'TEXT HERE'部分被刷掉或什麼東西。有沒有一種方法可以在整個文件中查找這些內容,以便獲取「內容」標籤的所有「值」?

<mtg:Property displayName="Content" hidden="false" name="content" nullable="true" 
readonly="false" type="string"> 
       <mtg:Value>TEXT HERE</mtg:Value> 
</mtg:Property> 

感謝您的任何幫助。

+0

檢查:http://www.w3.org/TR/xpath /#location-paths – Madthew 2013-05-09 12:01:27

+0

不要使用正則表達式解析XML。有用於製作XPath查詢的命令行工具,它們會更好地工作。另外,什麼是所有的報價?它看起來不是有效的XML – 2013-05-09 12:09:07

+0

你確定你的文件不是有效的XML嗎?然後請更新問題。在任何情況下,如果您在行首添加四個空格,markdown解析器將不會觸及您的文件示例。使用[編輯]鏈接根據需要更新問題。我將它編輯成有效的XML – 2013-05-09 12:27:53

回答

0
awk '/content/ {print $2}' FS='<mtg:Value>' RS='</mtg:Value>' 
  • 集合記錄分離到</mtg:Value>
  • 設置字段分隔符<mtg:Value>
  • content和打印領域的查找記錄2