2016-04-25 18 views
1

當我使用一個HTML文件( 'SimplePage.html'),內容如下LibreOffice的HTML轉換爲PDF格式的命令行(在Windows 7 LibreOffice_5.1.2)產生空白頁

<!DOCTYPE html> 
<html> 
    <title>Page Title</title> 
    <body> 
    This is just a simple Hello World 
    </body> 
</html> 

的LibreOffice產生了在第一頁空白,然後寫不完整的文本的PDF - 我使用下面的命令行

顯示

而不僅僅是「一個簡單的Hello World

soffice.exe --headless --convert-to pdf SimplePage.html 

當我在非headless模式下進行轉換時(打開Libreoffice writer並使用「Export」生成的pdf是正確的。因此我認爲這不是使用的HTML的問題。 有誰知道這個問題的原因和解決方案?

+0

?如果它從頁面的左邊緣開始,那麼可能是句子的開始是「關閉頁面」,即文本的起始座標由於某種原因是負面的(當我們將左邊緣視爲零座標時) 。您也可以查看pdf內容以查看實際存在的文本(如果未過濾頁面的內容流,則更容易)。 – ain

+0

是的,測試顯示在左上角的第二頁上。它看起來並不像文本在文件內部,因爲一些pdf閱讀器無法找到字符串的任何部分。我也嘗試通過記事本++查看內容,但沒有取得任何成功。奇怪的是,通過自由職業者的圖形界面PDF正確創建 – Shannon

回答

2

你應該試着扭動這樣的:

soffice.exe --headless --norestore --writer --convert-to pdf YOURFILE 

它爲我工作,有人添加如果顯示的文本--writer option

+0

你是對的!非常感謝! – Shannon

+0

要擴展此答案,默認情況下,Open/LibreOffice使用'writer_web_pdf_Export'過濾器將HTML轉換爲PDF。使用'--writer'選項或'* writer.exe'二進制文件將默認值更改爲'writer_pdf_Export',這似乎對許多文檔來說效果更好。另一種選擇是指定您想要使用的確切過濾器:'--convert-to pdf:writer_pdf_Export'以及任何特定於過濾器的選項。 – Tobia