我寫了一個正則表達式代碼來從HTML文件中提取錨標籤並得到了這個輸出。如何解決這個sed語法問題
mdlinks.txt
<a href='/aspnet/aspnet_refhtmlcontrols.asp'>ASP.NET Reference</a>
<a href='/aspnet/webpages_ref_classes.asp'>Razor Reference</a>
<a href='/html/html_examples.asp'>HTML Examples</a>
<a href='/css/css_examples.asp'>CSS Examples</a>
<a href='/w3css/w3css_examples.asp'>W3.CSS Examples</a>
<a href="/js/js_examples.asp" target="_top">JavaScript Examples</a>
<a href="/js/js_dom_examples.asp" target="_top">HTML DOM Examples</a>
我必須代表輸出作爲
「文本顯示」使用sed的工具。
<a[\s]href=('|")([^>]+)">((?:.(?!\<\/a\>))*.)<\/a>
這是我的正則表達式,它捕獲文本和href鏈接。
這裏是sed命令我寫
sed -E "s/\"<a[\s]href=('|\")([^>]+)\">((?:.(?!\<\/a\>))*.)<\/a>\"/\[\2\] \(\1\)/" mdlinks.txt
但是這給了我的錯誤。 有些人可以幫我嗎?
你什麼錯誤?而期望的輸出是什麼樣子? – tink
您正在嘗試使用某些不受sed或任何其他標準UNIX工具支持的regexp變體(可能是PCRE?idk)。發佈[mcve],我們可以幫助你。 –
您不能在sed中使用非捕獲組'(?:)'。 –