我使用的是textract python-pptx來提取文件的文本內容,效果很好。不幸的是,我們的客戶端也有需要處理的ppt文件,但我們在服務器中沒有任何MS Office/Open Office,因此我無法使用comtypes將ppt文件轉換爲其他文件類型,只需執行從那裏提取。Python 3.6從PPT文件中提取文本
非常感謝任何替代方法的建議。
我在Windows 64位機器上運行Python 3.6。
我使用的是textract python-pptx來提取文件的文本內容,效果很好。不幸的是,我們的客戶端也有需要處理的ppt文件,但我們在服務器中沒有任何MS Office/Open Office,因此我無法使用comtypes將ppt文件轉換爲其他文件類型,只需執行從那裏提取。Python 3.6從PPT文件中提取文本
非常感謝任何替代方法的建議。
我在Windows 64位機器上運行Python 3.6。
在這裏轉換它們。 https://convertio.co/ppt-pptx/這將允許你在你的程序中使用它們。
對不起,我忘了環境也無法連接到互聯網,因爲他們的數據包含高度敏感的信息 – mtryingtocode
根據https://stackoverflow.com/a/24194435/ 7869371它看起來像最新版本可以讓你打開PPT文件。你試圖打開一個錯誤信息時會看到什麼? – James
我的建議是安裝OpenOffice/LibreOffice ... –