如果你不會有圖案的多於一個的單行線,我可能會使用sed
:
sed -n -e 's%.*https://\([-.0-9A-Za-z]\{1,\}\.[A-Za-z]\{2,\}\).*%\1%p'
考慮到數據文件:
Nothing here
Before https://example.com after
https://example.com and after
Before you get to https://www.example.com
And double your https://example.com for fun and happiness https://www.example.com in triplicate https://a.bb
and nothing here
的sed
腳本每行生成一個條目,當線上有多個條目時顯示最後一個條目:
example.com
example.com
www.example.com
a.bb
Perl腳本可用於每行多個條目:
$ perl -nle 'print $1 while (m%https://([-.0-9A-Za-z]+\.[A-Za-z]{2,})%g);' data
example.com
example.com
www.example.com
example.com
www.example.com
a.bb
$
請示例。 「前綴」是什麼意思? –
「https://」將作爲前綴。 – cnst
「regexp」是什麼意思?字符串的例子會有所幫助。 – Kenosis