2013-08-27 82 views
0

首先,我同意這可能聽起來像是過去曾多次提出過的問題。然而,在類似的問題中,我找不到與我相關的任何答案,所以我會盡量更具體。django/python:如何使用python將pptx/docx格式轉換爲PDF?

我需要使用Python將PPTX/DOCX文件轉換爲PDF但我沒有任何文件格式轉換的經驗。我一直在尋找在許多地方/論壇/網站,閱讀了大量的文檔和遇到一些有用的庫(蟒蛇,PPTXpyPdf爲主)來了,但我還是不知道從哪裏開始。

在Internet上來看,我可以看到很多網站,提供文件格式轉換爲付費服務,即使有先進的API:通過POST提交文件並獲得轉換PDF文件中的回報。這可能對我有用,但我真的很有興趣寫自己的代碼,將OOXML轉換爲PDF。

你會如何開始這樣做?還是僅僅靠我自己不可能?

感謝您的幫助!

+1

你可以參考這個問題:http://stackoverflow.com/questions/6011115/doc-to-pdf-using-python – sandeep

+0

我不知道這一點;非常感謝。不過,我正在研究Linux。任何(其他 - 一樣好)的想法? – jlibioul

回答

1

經過一番研究,並與蟒蛇,PPTX格式的創造者的幫助下,我能寫使用虛擬機的PowerPoint演示COM接口。

如果有人讀這個線程,這是我設法完成這個任務: - 安裝一個VM上安裝了Microsoft Windows/Office; - 在VM上安裝Python,Django和win32com庫。

文件被局部地從原始Django項目通過簡單的POST請求發送到虛擬機(其是在同一網絡上)。使用win32com.client(這只是對win32com.client庫的簡單調用)在VM上轉換文件,然後將其作爲對原始Django視圖的響應發送回來,然後處理響應。

注:我花了一些時間來實現我需要使用此設置工作的@csrf_exempt裝飾。

相關問題