2012-03-12 39 views
1

我有很長的一行:如何grep在HTML文本中的多個非貪婪的匹配?

<div class="interesting">This is interesting1</div><div class="not interesting">Some text</div><div class="interesting">This is interesting2</div><div class="not interesting">Some more text</div> 

我如何可以提取如下:

This is interesting1 
This is interesting2 

從用grep上面的文字?有什麼建議麼?

cat temp | grep -o "<div class=\"interesting\">.*?</div>" 

似乎沒有給出任何東西。

回答

1
cat temp | grep -P -o "<div class=\"interesting\">(.*?)</div>" 

括號匹配的HTML標記裏面的物品項目。

+1

謝謝。我已經嘗試過,但由於某種原因,這不會給我任何輸出。 – Legend 2012-03-12 21:31:42

+1

+1我修改了你的答案,包括'-P'標誌,現在它的工作。謝謝! – Legend 2012-03-12 21:34:30

+0

不錯!接受答案? – iambriansreed 2012-03-12 21:38:41