我用pdftk解壓縮了一個PDF文件,我試圖在Emacs中用正則表達式編輯它。搜索或轉換八進制序列
問題是這個文件有重音字符,Emacs把它們顯示爲八進制序列:用於à的\340
。編輯這個文件我有兩種可能性(至少我是這麼認爲的)。
a)應用一種編碼,Emacs將顯示實際重音字符而不是其八進制等效字符。 Vim已經正確顯示重音字符;
b)用正則表達式搜索八進制序列。對於a),我嘗試了(set-buffer-file-coding-system'utf-8-dos),(set-buffer-file-coding-system'utf-8-unix),(set緩衝文件編碼系統「原始文本),但沒有成功。
至於b),在應用set-buffer-file-coding-system後,我可以用C-q ... RET
遞增搜索八進制序列,但我無法做到我真正需要的:替換字符串。實際上C-q ... RET
,在使用M-%
或C-M-%
時不符合八進制序列。 C-x 8
也不起作用。`...
在此先感謝。 安東尼
你能上傳一個樣本PDF的地方嗎? – user4815162342
新手在這裏,希望有可能發佈鏈接。無論如何,我只是創建了一個單行測試文件: http://www.filedropper.com/test_16。 在Emacs看看第47行,並注意如何使用à手動替換'\ 340',並在PDF查看器中保存並重新打開它。 – antonio
單個高位八進制字符肯定不是UTF-8。嘗試使用CP1252或CP850。 – tripleee