2015-04-18 119 views
0

我使用unoconv(https://github.com/dagwieers/unoconv)將DOCX和DOC文件轉換爲PDF,但在PDF中呈現某些字符時,通常會得到奇怪的結果。使用unoconv獲取奇怪的字符轉換從docx/doc轉換爲pdf

一個特別的問題是例如奇怪翻譯號碼,的部分標籤:

2.3節(http://note.io/1Q33RX6

獲取真實變成了羅馬數字:

II.3節(http://note.io/1b6MDs5

我有一種感覺,這與安裝字符集有關,但不知道如何調試它。

問題的設置是一個Django應用程序,它調用一個unix shell腳本來轉換磁盤上的文檔。

+0

(咳嗽)我看不出有什麼不同。這些鏈接是否指向完全相同的圖像?無論如何,鏈接到PDF將有所幫助。通常情況下,PDF的渲染不會依賴於「已安裝的字符集」(引用,因爲它現在是一個相當古怪的語句 - 你的意思是「字體」?)。如果數字是自動生成而不是鍵入的,則錯誤在於轉換軟件。 – usr2564301

+0

對不起,我更正了上面的第二個鏈接。我使用了字符集這個詞,因爲在我使用該術語時,我有警告消息。 – rkp333

回答

1

unoconv只是以編程方式打開該文件,然後將其保存/導出爲所需的格式。我希望在使用LibreOffice打開文件並從GUI保存文件時也會發生同樣的情況。

如果是這種情況,您可能需要使用最新的LibreOffice版本進行測試,如果這樣無法解決您的問題,請將問題報告給LibreOffice錯誤跟蹤器。

+0

謝謝你。是的,我似乎是Libre Office的一個問題,當文檔在那裏打開時,同樣的事情發生。在Word中打開工作正常。 – rkp333