2012-12-30 57 views
1

我有一個PDF文件的表格,圖像等。我想將此PDF文件的文本翻譯成另一種語言,並創建一個類似於第一個文件但包含翻譯文本的PDF文件(它應該具有圖像,表格,如第一個文件)。如何翻譯PDF文件?

我該如何編寫一個用C++編寫的程序來完成這項工作?

我有一個程序可以從PDF文件中提取文本並轉換文本,但是我無法在特殊位置創建帶有表格和圖像的輸出PDF文件。我如何創建一個具有原始文件格式的PDF文件?

回答

0

您的程序應該讀取內存結構中的PDF(如對象樹),然後翻譯內存中的文本葉,然後將內存結構轉儲回PDF。 爲此,您需要一個pdf解析庫,它允許您操作對象表示。

我不是C++開發人員,所以我不知道C++庫Universe;但從谷歌快速搜索,它看起來像PoDoFo可以做這份工作。