我想操作一個ZDT格式的詞彙表,即:Traditional Characters \t Simplified Characters \t Pinyin \t English \n
。我想在行首開始刪除繁體字符,所以我試圖用sed 's/^[^\t]*\t//g' input.txt > output.txt
將它們刪除,但是這使我無法接近我想要的結果,因爲在某些行中,英文部分中某處的所有內容都將被刪除,並在其他行什麼都不刪除,我不能弄出一個模式。sed刪除文本的不同部分
我認爲RegEx是正確的,因爲我測試過它here和Sublime Text 2也可以按照預期使用它。這裏有什麼問題?
編輯:
input.txt
開頭http://pastebin.com/fRemVPyT
的output.txt
http://pastebin.com/EJkszFNF
這'sed'命令似乎對我很好('/ g'標誌是無用的)。你能否提供一些不符合你期望的輸入數據? – Birei
@Birei我加了一個sed yield的例子。 –
它適用於我。請注意,您在檢測到標籤並刪除後纔會發現文字「t」字符。也許是一個'shell'問題,一個老的'sed'版本或類似的東西。嘗試兩次轉義'\\ t'。 – Birei