2013-04-24 22 views
1

我目前正在實施Oracle的OutsideIn搜索和導出工具以提取不同文件的元數據和內容。我能夠在一個文件夾內的多個文件上執行此操作,但是我無法提取嵌入在另一個文件中的文件。我想知道這在搜索和導出中是否可行。通過Oracle搜索和導出提取多個嵌入文件

如果不是,我會選擇CleanContent,但它只接受Microsoft和PDF文件。

回答

1

搜索導出可以從檔案或其他類型的文件中轉換或提取嵌入式文件。我們區分三種不同類型的嵌入,每種嵌入都有自己的選項來控制其轉換。這三種類型是歸檔子文檔,電子郵件附件和通用嵌入。默認情況下,前兩個轉換,但第三個不是。要啓用通用嵌入轉換,請在SCCOPT_XML_SEARCHML_FLAGS選項中設置SCCEX_XML_EMBEDDINGS標誌。如果您使用SDK附帶的導出器示例應用程序,請嘗試在CFG文件中啓用以下內容。

embeddingsflag是

如果你正在試圖提取嵌入的二進制副本,就變成了三個步驟。在初始轉換時,在SCCOPT_XML_SEARCHML_FLAGS選項中設置SCCEX_XML_PRODUCEOBJECTINFO標誌。將這些信息用於所需的嵌入以填充傳遞給DAOpenDocument的SCCDAOBJECT結構。從該函數返回的hDoc可以傳遞給DASaveInputObject以保存嵌入的二進制副本。這適用於上述三種嵌入中的任何一種。沒有Java示例應用程序演示此過程。