我有一個字(.DOCX)文件具有標題/標題和標題低於其相應的表(.DOCX)提取表中的標題:從Word使用Python
1.1.1.1 Table_Title_001
Name Gautham
College Oxford
University Cambridge
1.1.1.2 Table_Title_002
Name Krishnan
College Harvard
University Stanford
是否有任何如何使用Python提取每個表的標題? win32com或python-docx的文檔對此不太清楚。
在程序運行的機器上是否安裝了Word?或者您是否在尋找可以運行的解決方案,例如,在Linux服務器上運行? –
@Doc Brown Word安裝在我的機器上。我期望使用任何外部Python模塊(如win32com.client API或Python-docx)來提取表格標題。提前致謝。 – gautham
那麼你的一般策略應該是:谷歌如何做到你想要的VBA。使用win32com將解決方案移植到Python(請參閱http://docs.activestate.com/activepython/2.4/pywin32/html/com/win32com/HTML/QuickStartClientCom.html)。注意Word的COM API和VBA API幾乎完全相同。 –