2016-06-16 37 views
1

我有一個Word DOCX按以下格式獲得表的標題:試圖使用python的docx

Title 

- text 

Title1 

- Description 

Title2 
- Definition 
- Table2 
- text 

Title3 

- Definition 
- Table3 
- text 
... 

我使用python的docx,並想獲得與每一個「表匹配的「標題」 「(即最接近表格的標題,所以title2與表格2)。有沒有辦法做到這一點?

我知道我們可以通過這樣的文檔遍歷:

for para in doc.paragraphs: 
    print(para.text) 

但是這將使它很難匹配標題表。有沒有更好的方法來做到這一點?

回答

0

這個線程在GitHub的問題清單可能會有所幫助: https://github.com/python-openxml/python-docx/issues/40

如果添加iter_block_items()函數,請確保您使用在向線程結束的一個,它必須進化出位隨着時間的推移,它會利用可能會發生變化的內部結構。