我目前正在嘗試學習Linux命令和正則表達式,我陷入了一個小問題,我試圖使用sed和正則表達式在文件中找到一系列鏈接,任何人都可以幫助我工作這出了什麼地方,我錯了。鏈接是這樣的與正則表達式找到鏈接
<a href="../a-lot-of-different/words-that/should-link.html">Useful links</a>
<a href="..//a-lot-of-different/words-that/should-find-lots-of-links.html">Multiple links</a>
<a href="../another-word-and-links/multiple-words/sjshfi-dfg.html">more links</a>
這就是我所擁有的。
sed -n '/<a*href=」^[../"]*\([a-z]*\)^[.html](["]*\)/p' /file > newfile
如果它是一個HTML文件,我建議使用DOM解析器。請參閱http://unix.stackexchange.com/questions/6389/parse-html-on-linux和http://stackoverflow.com/questions/893585/how-to-parse-xml-in-bash – Phil 2014-10-29 23:31:32