我一直在考慮用大量以.xml格式的Word文檔的一系列文件夾。它們每個都包含一些VBA代碼,但所有代碼都已經運行,所以我不需要保留這些代碼。如何將XML Word文檔轉換爲DOCX?
我需要打印每個文件夾中的所有文件,但由於網絡上XML文件的限制,我無法簡單地從Windows資源管理器批量打印它們,所以我需要將它們轉換爲.docx(或.doc)。
我該如何去做這件事?
import os
from docx import Document
folderPath=<folderpath>
fileNamesList=os.listdir(folderPath)
for xmlFileName in fileNamesList:
currentDoc=Document(os.path.join(folderPath,xmlFileName))
docxFileName=xmlFileName.replace('.xml','.docx')
currentDoc.save(os.path.join(folderPath,docxFileName))
currentDoc.close()
這讓:我使用python-DOCX嘗試一個簡單的Python腳本
docx.opc.exceptions.PackageNotFoundError: Package not found at <first file name>.xml
我猜這是因爲Python-的docx並不意味着打開.xml文件,但這是一個相當沒有教養的猜測。四處搜尋這個錯誤,我能找到的所有問題都是它沒有正確安裝(據我所知),或使用.doc文件而不是.docx。
我,我只是使用python-DOCX不正確?如果沒有,我是否應該使用更適合的包裝或技術?
當文件不是有效的或空的docx文件,那種異常被拋出 – Ludisposed