2011-01-21 31 views
2

我正在尋找一個可以打開ppt,pptx,doc,docx文件的庫來解析它並從中提取所有對象。尋找解析和提取ppt,pptx,doc,docx文件中的對象的庫

例如,在ppt中,它可以提取所有對象的屬性,如圖像,文本,表autoshapes等..然後提供對象的位置/大小和格式,如字體大小/顏色/大膽等..和圖像的能力將每個圖像保存爲jpg文件。 圖書館還應該能夠拍攝整張幻燈片的快照。

我試過aspose這樣做,但是在獲取這些信息時不準確。不提取所有屬性加上它的導出,因爲圖像不準確。有沒有使用開放式辦公室圖書館這樣做的想法?

我打開使用Java或C++庫。

回答

1

在工作中,我們使用openoffice Java API從ppt/pptx文件中提取圖像。我使用了here的文檔。我很肯定你可以使用該指南中的信息來做你需要的。

祝你好運。

+0

非常感謝你的幫助 你能否指出一個簡單的例子來從ppt/pptx文件中提取圖像,我需要比較提取的圖像和我從aspose獲取的圖像以做出決定切換到開放辦公室 在此先感謝 – mmohab 2011-01-21 11:53:16

1

一個選項是apache poi庫 - 這裏有一些例子,似乎有更多的材料比openoffice API要多。

相關問題