我正在嘗試編寫一個讀取docx文件並檢查某些文本是否有顏色的程序。例如,想象一下如果所有在這句話中加粗的字實際上是以任意顏色寫成的。我希望我的程序能夠認識到,「這句話中的粗體字實際上是用某種任意顏色書寫的」這些詞都是有顏色的。從文檔中識別文本中的顏色
然後,在識別着色後,我希望能夠根據顏色編輯識別的文本。例如,如果上面加粗的文本是紅色的,我想在文本週圍添加「Red>」標籤,同時仍然保留未着色的句子的其餘部分。
我最初使用ZipInputStream和ZipEntry來獲取「word/document.xml」,並且我計劃從那裏拉動文本和顏色,但是我覺得這會在一段時間後變得太混亂。我也嘗試過使用Apache poi,但我不認爲它能夠識別顏色。 Docx4j看起來很有前途,不過。任何想法,建議或示例代碼讓我開始?