我有一個帶有html內容的.sql轉儲。我想從<img...>
字符串中刪除標題=「....」。棘手的部分是,這些標題=「.....」等出現在<href.....>
部分的一行。在sed中替換搜索字符串中的字符串
爲了使它更加明顯我用下面的字符串2行文件:
A B C D B C A B C
Y B C D B C Y B C
在B reprecents的title="...."
部分和A....C
是<img....>
部分
生成的文件應該像
A C D B C A C
Y B C D B C Y B C
只有B
應該在A...C
內移除和第二行應該是未觸及的
我使用sed,因爲我知道這個最好,但如果有人知道我有興趣知道更好的方法。
直到現在我用下面的命令
cat file |sed '/A/ s/B/X/g'
問題是,它也取代了B
內D...C
A C D C A C
Y B C D B C Y B C
任何想法將appriciated。
問候,
阿爾揚
PS:真實生活中的例子,只有一行:
nbsp;</p><p> <img src="images/vlaggen/dene_vlag.png" border="0" alt="Vlag van Denemarken" title="REMOVE THIS TITLE" width="75" height="50" align="left" /> <a href="images/hov.png" target="_blank" title="DONT REMOVE THIS TITLE"><img src="images/small.png" border="0" alt="Kaart van Denemarken" title="REMOVE THIS TITLE" align="right" /></a> <br /><br /> </p><p> </p><h1>Title of page</h1>
一號線的解決方案: - 編寫自定義的解析器(搜索模式和刪除後續字符串) –
恐怕除非你發佈一個例子,您會收到類似'的sed的響應/ ABC/AC/g'文件'爲例。 – devnull
的確如此。我對此很清楚。要有一個真實的例子,這是一個真實數據的例子。請注意,標題=「....」可能在其他地方以及其他數量的出現在一行中。我上面添加了一個真實的例子。 –