好的,這是一個容易的,但我無法弄清楚。如何打印只與sed匹配?
基本上我想從一個大的html
文件中提取所有鏈接(<a href="[^<>]*">[^<>]*</a>
)。
我試圖用sed
做到這一點,但我得到了各種結果,只是不是我想要的。我知道我的正則表達式是正確的,因爲我可以替換文件中的所有鏈接:
sed 's_<a href="[^<>]*">[^<>]*</a>_TEST_g'
如果我運行在類似
<div><a href="http://wwww.google.com">A google link</a></div>
<div><a href="http://wwww.google.com">A google link</a></div>
我得到
<div>TEST</div>
<div>TEST</div>
如何我可以擺脫一切,只是打印比賽?我的首選最終結果是:
<a href="http://wwww.google.com">A google link</a>
<a href="http://wwww.google.com">A google link</a>
PS。我知道我的正則表達式不是最靈活的,但對我的意圖已經足夠了。
是'sed'一個需求? ('grep -o')? –
謝謝,這也適用。我仍然想知道sed是否可能。 – DrummerB