抓取TEXT塊中的特定行

我有一個大的TEXT（XML？）轉儲，我只想拿出包含我的內容的行。抓取TEXT塊中的特定行

例如，我希望'TEXT HERE'部分被刷掉或什麼東西。有沒有一種方法可以在整個文件中查找這些內容，以便獲取「內容」標籤的所有「值」？

<mtg:Property displayName="Content" hidden="false" name="content" nullable="true" 
readonly="false" type="string"> 
       <mtg:Value>TEXT HERE</mtg:Value> 
</mtg:Property>

感謝您的任何幫助。

來源

2013-05-09 Tim Edwards

檢查：http://www.w3.org/TR/xpath /＃location-paths – Madthew 2013-05-09 12:01:27

不要使用正則表達式解析XML。有用於製作XPath查詢的命令行工具，它們會更好地工作。另外，什麼是所有的報價？它看起來不是有效的XML – 2013-05-09 12:09:07

你確定你的文件不是有效的XML嗎？然後請更新問題。在任何情況下，如果您在行首添加四個空格，markdown解析器將不會觸及您的文件示例。使用[編輯]鏈接根據需要更新問題。我將它編輯成有效的XML – 2013-05-09 12:27:53

awk '/content/ {print $2}' FS='<mtg:Value>' RS='</mtg:Value>'

集合記錄分離到</mtg:Value>
設置字段分隔符<mtg:Value>
含content和打印領域的查找記錄2

來源

2013-05-09 15:56:53

抓取TEXT塊中的特定行

回答

相關問題