我想編寫一個shell腳本,它將從標準輸入讀取文件,刪除所有字符串和空行字符,並將輸出寫入標準輸出。該文件是這樣的:編寫shell腳本
#some lines that do not contain <html> in here
<html>a<html>
<tr><html>b</html></tr>
#some lines that do not contain <html> in here
<html>c</html>
因此,輸出文件應包含:
#some lines that do not contain <html> in here
a
<tr>b</html></tr>
#some lines that do not contain <html> in here
c</html>
我嘗試寫這個shell腳本:
read INPUT #read file from std input
tr -d '[:blank:]'
grep "<html>" | sed -r 's/<html>//g'
echo $INPUT
但是這個腳本不工作在所有。任何想法? THX
你可能想試試這個在Perl(或超過一定的外殼以外的東西)如果可能的話:[檢查出這個問題的答案](http://stackoverflow.com/questions/3176842/strip-html-tags-with-perl) – summea 2013-03-19 19:50:02
@summea我不能。我必須使用#!/ usr/bin/bash – 2013-03-19 19:52:07
應該保留註釋嗎? – 2013-03-19 19:52:12