我想要改造這個文本(刪除<math>.*?</math>
)使用sed,awk的或Perl:如何從使用perl,sed或awk的內容的非常大的多行文本文件剪切html標記?
{|
|-
| colspan="2"|
: <math>
[\underbrace{\color{Red}4,2}_{4 > 2},5,1,7] \rightarrow
[2,\underbrace{\color{OliveGreen}4,5}_{4 < 5},1,7] \rightarrow
[2,4,\underbrace{\color{Red}5,1}_{5 > 1},7] \rightarrow
[2,4,1,\underbrace{\color{OliveGreen}5,7}_{5 < 7}]
</math>
|-
|
: <math>
[\underbrace{\color{OliveGreen}2,4}_{2 < 4},1,5,{\color{Blue}7}] \rightarrow
[2,\underbrace{\color{Red}4,1}_{4 > 1},5,{\color{Blue}7}] \rightarrow
[2,1,\underbrace{\color{OliveGreen}4,5}_{4 < 5},{\color{Blue}7}]
</math>
: <math>
[\underbrace{\color{Red}2,1}_{2 > 1},4,{\color{Blue}5},{\color{Blue}7}] \rightarrow
[1,\underbrace{\color{OliveGreen}2,4}_{2 < 4},{\color{Blue}5},{\color{Blue}7}]
</math>
: <math>
[\underbrace{\color{OliveGreen}1,2}_{1 < 2},{\color{Blue}4},{\color{Blue}5},{\color{Blue}7}]
</math>
|}
到這些文字(請原諒我,如果我刪除了太多 - 我應該刪除<math>.*?</math>
):
{|
|-
| colspan="2"|
:
|-
|
:
:
:
|}
我讀了大約20頁並測試了10個腳本,但沒有好的結果。最好的我做的是:
cat dirt-math.txt | awk '/<math>/{cut=1; print;}/<\/math>/{cut=0}!cut'
不管它沒有正常工作,因爲左派<math></math>
這是不壞,但我不知道awk來提高更多。
謝謝你的建議我不知道awk,所以你的建議將允許做下一步,這對我來說非常困難。 – Chameleon
由於'
我會再次檢查,因爲我犯了錯誤:) – Chameleon