2013-10-24 116 views
0

我有一個帶有換行符或回車符的大文件。該文件來自HTML,我除去了要轉換爲換行符(/ n)的所有標籤。使用AWK或SED執行此操作的快速而簡單的方法是什麼?我想AWKSED也是一種選擇。使用awk或sed替換帶有換行符的HTML標記

+0

告訴我,沒有真正名爲'AWKSED'的東西!發佈一些示例輸入和預期輸出。 –

回答

0

像這樣的東西應該工作:

sed 's/<[^>]*>/\n/g' file 

這意味着:更換開始<所有文字,其次是不>字符數目不詳,並且與>結束,有一個換行符。

+0

因此,如果我把/ tr放在括號中,它應該用換行符替換所有出現的標記? –

+0

是的,由於'g'命令,並且因爲'[^>]'做了一個非貪婪的匹配,所以這會更新所有與換行符相關的事件。 – user000001

+0

我對你的修改有點困惑。如果標籤是/ tr,那麼我的解決方案中用/ tr替換了什麼? ^>或者*? –