(下面是我無法粘貼我看到的字符,BB
將表示一個字符是數字0080的正方形,後面跟着一個數字爲0094的正方形)。難以用sed代替的字符
我在ISO文件編輯器中看到這個帶有âBB
而不是–
的ISO-8859-15編碼的字幕文件。
如果我用cat
讀取文件,破折號會正常顯示,但如果我照原樣使用該文件,它將在視頻字幕上顯示â€」
。
我試圖與SED替代,沒有成功:
sed 's/âBB/–/g' thisfile > correctedfile
sed 's/â€」/–/g' thisfile > correctedfile
我第一次嘗試它的命令行和編號方框不出現的話,我有一個腳本試了一下。
我甚至試圖與
sed 's/â../–/g' thisfile > correctedfile
作弊,並沒有工作。
cat
和sed
看到它完美的 - ,所以我想
sed 's/–/–/g' thisfile > correctedfile
,但它也不能工作。
然後我試着recode iso885915..utf8 thisfile
,反之亦然,什麼也沒有。
如果我在kate
中定期查找並替換,它會修復它。但是由於問題出現在我想用命令行中的for; do; done
循環解決的其他文件中,但爲此我需要知道如何解決其中的一個問題。
爲什麼這些解決方案不起作用,我錯過了什麼以及如何使它工作?
請嘗試查看sed所見的文件。使用'sed -n l file',然後在替代命令中使用這些值。 – potong
'cat'和'sed'完全看作是 - ,然後我嘗試了'sed's/-/-/g'',但它也不起作用。 – Strapakowsky
我不使用sed,但是這是怎麼回事:http://www.cyberciti.biz/faq/unix-linux-sed-ascii-control-codes-nonprintable/? –