我試圖將使用西班牙文本的pdf文件轉換爲在Mac上使用ghostscript的.txt文件。除西班牙語專用字符(例如í,ó)無法正確顯示(例如í顯示爲「¿≠」)外,一切運作良好。有誰知道如何解決這一問題?當使用ghostscript將.pdf轉換爲.txt時,西班牙字符顯示不正確
這是一個工作示例。在example.pdf文件中放置以下文本:
Este planetaademásposee eldíamáslargo del sistema solar:243díasterrestres,y su movimiento esdextrógiro,es decir,gira en el sentido de las manecillas del reloj, contrario al movimiento de los otros planetas。 Por ello,en undíavenusiano el Sol sale por el oeste y se se oculta por el este。
然後運行
gs -sDEVICE=txtwrite -o output.txt example.pdf