我試圖從文本文件中濾除包含除字母之外的任何字符的所有單詞。我已經瀏覽了stackoverflow和其他網站,但是我發現的所有答案都是針對不同場景的,而且我無法將其複製到我的目的中;我最近纔開始學習Unix工具。擺脫文本文件中包含特殊字符的所有單詞
這裏是我想要做的一個例子:
輸入:
@derik I was there and it was awesome! !! http://url.picture.whatever #hash_tag
輸出:
I was there and it was awesome!
所以標點符號的話可以留在文件中(其實我需要他們留下來),但任何具有特殊字符(包括標點符號)的子字符串都需要修剪掉。這可能可以用sed完成,但我無法弄清楚正則表達式。幫幫我。
謝謝!
你有'punctuation'字符不屬於名單中刪除? – anubhava
*特殊字符*是什麼意思? – melpomene