我試圖提取DOCX Word文檔中的表格內容,以及男孩我是xml/xpath的新手。從python的DOCX Word文檔中提取表格
from docx import *
document = opendocx('someFile.docx')
tableList = document.xpath('/w:tbl')
這會觸發「XPathEvalError:未定義的命名空間前綴」錯誤。我相信這只是開發腳本時期望的第一個。不幸的是,我找不到python-docx的教程。
您能否提供一個表格提取的例子?
你從哪裏弄來的docx?你能提供一個URL嗎? –
你應該尋找一個python xml教程。根據消息來源,opendocx函數返回一個xml文檔。 python-docx庫中的其餘功能是圍繞lxml python庫的包裝器,在http://lxml.de/中是這樣的。 –
@Spencer Rathbun:下面的代碼不會引發錯誤,但奇怪的是[] 'tableList = document.xpath('// tbl')' 'print tableList' 這是一些DOCX功能,我不理解? – mgierdal