0
多行我有很多的標籤的HTML頁面這樣如何到grep從HTML頁面
<tr>
<td> a </td>
</tr>
<tr>
<td> a </td>
</tr>
<tr>
<td> a </td>
</tr>
我需要到grep所有這些塊只留下所有其他內容(如普通文本)。
我在pcregrep上看到了一些其他帖子,但對我而言並不清楚。
有人能幫我用grep(或其他解決方案)嗎?
多行我有很多的標籤的HTML頁面這樣如何到grep從HTML頁面
<tr>
<td> a </td>
</tr>
<tr>
<td> a </td>
</tr>
<tr>
<td> a </td>
</tr>
我需要到grep所有這些塊只留下所有其他內容(如普通文本)。
我在pcregrep上看到了一些其他帖子,但對我而言並不清楚。
有人能幫我用grep(或其他解決方案)嗎?
您可以使用sed
來獲取所有這些塊:
$ sed -n '/<tr>/,/<\/tr>/p' input.html
<tr>
<td> a </td>
</tr>
<tr>
<td> a </td>
</tr>
<tr>
<td> a </td>
</tr>
見我回答這個previous question。基本上你使用grep
s -z
選項加上一個非常具體的正則表達式。
這將提取第一個
如果'
忘記它了。它很難帶來代碼格式的評論。厭倦了讓評論看起來更好。解決這個可能比原來的問題更困難..我放棄了。 – Kent 2012-03-05 14:44:04