2013-10-02 37 views
-1

我用sed來操作一個html文件,這樣就可以將其導入到WordPress的 現在我有統一的標籤 如HTML標記SED搜索,只留下第一個和最後一個條目

`<Article> .... <ShortCut>... some text <ShortCut> some more text ... </ShortCut> 
<ShortCut> some more text ... </ShortCut></ShortCut> </Article>...` 

restult問題建議立即進行刪除是:

`<Article> .... <ShortCut>... some text some more text ... some more text ... </ShortCut> 
</Article>...` 

有與SED的方式消除所有這些快捷標籤,只留下第一個和標籤條之間的最後?

thx任何幫助!

更新:在輸入文件中有多個文章。因此,我只能鞏固每篇文章部分

+0

是不是都在同一行? – Beta

+1

是所有在一行 – Roland

回答

0

的快捷鍵使用awk

awk -F"</?ShortCut>" '{printf "%s <ShortCut>",$1; for (i=2;i<NF;i++) printf $i;print "</ShortCut> " $NF}' file 
<Article> .... <ShortCut>... some text some more text ... some more text ... </ShortCut> </Article>... 
+0

thx爲快速的答案!因爲我有更多

..
..
在一個文件中,我如何限制文章開始/結束之間的搜索?謝謝! – Roland

+0

thx爲解決方案。我已將所有放在新的lineas中,所以我可以使用您的腳本。它工作完美。謝謝! – Roland

相關問題