2011-06-14 123 views
4

我想在充滿word文檔的文件夾上運行腳本,該文件夾可以讀取文檔並提取圖像及其標題(圖像正下方的文本)。從我所做的研究中,我認爲pywin32可能是一個可行的解決方案。我知道如何使用pywin32來查找字符串並將其提取出來,但我需要圖像部分的幫助。如何通過docx文件讀取並在發現圖像時發生事件?感謝您的任何幫助!我正在使用Python 2.7。使用Python從word文檔中提取圖像和文本

回答

2

docx文件可以解壓縮用於提取圖像。

1

您可以使用python模塊docx2txt來提取文本以及docx文件中的圖像