我想按照它們寫入Word文檔的順序來處理對象。我遇到的對象是段落,段落中的文字,段落中運行的文本,表格單元格中的表格和段落。到目前爲止,我有兩個有用的程序。 通過文件段落並獲得該段文本的文件;存儲在由[段落號]索引的列表中。同樣的程序能夠從運行中收集文本;存儲在由[段落#] [運行#]索引的2D列表中,但是我沒有發現運行比段落的整個文本更有用。 我的第二個程序遍歷整個文檔並找到表格。當它有一個表格時,它會逐行瀏覽單元格中的行,單元格和段落。在docx中按順序處理對象
現在,這些看起來像是我的目標的偉大構建塊。我想按順序收集文字。抽象地說,就好像閃爍的文本光標被一個人按住鍵盤上的右箭頭命令移動一樣。當文本光標在對象上移動時,它將通過標記對象的#號和對象類型的多個索引來存儲它們。
說我有子函數paragraph_read和table_read。說文檔有這個順序的對象:。我想通過這些和執行我的子功能,以這個順序:paragraph_read,paragraph_read,table_read,paragraph_read
我想知道我的程序是否可以通過像光標滑動右對象的文檔對象移動。
幫助很大程度上appreaciated。謝謝。
克里斯
有一些討論,並在此代碼,描述那個:https://github.com/python-openxml/python-docx/issues/40。請務必在最後進行一些更新以適應最新版本。 – scanny
這正是我想要做的。感謝指針。 -Chris – Chris
@scanny我無法理解此頁面上的代碼。你能說說我嗎?或者給我一些關於如何使用它的提示? – Chris