2012-12-09 55 views
2

我嘗試使用下面的命令LibreOffice的:使用 - 轉換到

soffice --headless --convert-to txt xyz.pdf --outdir ~/ 

但是轉換後的文件不包含文本轉換爲PDF文件,以純文本文件PDF格式轉換爲純文本,但一堆未被識別的字符。以下是一些文字它創建

PK^C^D^T^@^@^H^@^@Ås<89>A<85>l9<8a>.^@^@^@.^@^@^@^H^@^@^@mimetypeapplication/vnd.oasis.opendocument.spreadsheetPK^C^D^T^@^@^H^@^@Ås<89>A4éæSq^B^@^@q^B^@^@^H^@^@^@meta.xml<?xml version="1.0" encoding="UTF-8"?> 
<office:document-meta xmlns:office="urn:oasis:names:tc:opendocument:xmlns:office:1.0" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:meta="urn:oasis:names:tc:opendocument:xmlns:meta:1.0" xmlns:ooo="http://openoffice.org/2004/office" xmlns:grddl="http://www.w3.org/2003/g/data-view#" office:version="1.2"><office:meta><meta:document-statistic meta:table-count="1" meta:cell-count="2103" meta:object-count="0"/><meta:generator>LibreOffice/3.6$Linux_x86 LibreOffice_project/360m1$Build-102</meta:generator></office:meta></office:document-meta>PK^C^D^T^@^H^H^H^@Ås<89>A^@^@^@^@^@^@^@^@^@^@^@^@^L^@^@^@settings.xmlµWÛRâ@^P}߯ æ]^C¨,¤^@^K±\ÝeÕ"è^Þ&IC¦<9c>L§æBd¿~'^D,^WC­Fç»...2<97>s:§»ÏLú§<8f>)o,A*<86>[email protected]<87>MÒ^@^QaÌÄ[email protected]îf^W^G]r:üÔÇù<9c>EàÇ^X<99>^T<84>>P µ]¢^Zv»P~9= F 
^_©bÊ^W4^EåëÈÇ^LÄv<9b>ÿ|µ¿&+G^^9^S^O^C<92>h<9d>ù<9e><97>çùa~t<88>ráµz½<9e>·<9e>Ý.<8d>PÌÙâµTåêçT<88>øDTl(<83>Y<93>µ<9b>Íc¯|&<8d>M<90>Ϥi<93>áV<87>íë^Oû^[<82>òç<80>iH^Km^Z<9b>á"´^A±<94>þ<92>Aþ¤^Z©Ú÷ï<9e>{¦XÈa$<81>Î0#ÛI½Êì$^S<9a>^L<9b>}ï%È<9b><80>'0×n<90>^?°X'UÐíæq·Û{7þ%°ER^Y{·Ó9i<9d>T^ST^L^V)y}^RË^A#©¶%ñ<96>lN<90>ÆS 1 

這是相同的情況下,如果我嘗試轉換PDF文件到HTML或DOC

我做錯了嗎?

回答

1

嘗試在「txt」之後放置「文本」。 例如:

libreoffice --invisible --convert-to txt:Text filename.doc 

假設 「的LibreOffice」 和 「soffice」 有足夠的相同

+1

我相信這個人是問的LibreOffice(或soffice?)是否可以轉換.pdf文件(不.doc文件) - >至 - >文本。這是我引導到這篇文章的同一個問題。這個網頁右上角的信息表明這個問題是在一年前提出的。 – Jake

相關問題