2016-09-06 32 views
0

CPF將PDF轉換爲XHTML。這很好,當它在XHTML中,我有另一個管道豐富了數據。這也很好。管道PDF轉換原文件URI

我注意到我沒有從PDF轉換管道獲取原始文檔URI,只有XHTML文件的URI。

什麼我能做的就是用內容替換的結構轉換的XHTML URI,但在所有的管道我寧願保持原有的URI:

/converted/Berry, Steve - Het Venetiaans bedrog_pdf.xhtml 

into 

/pdf/Berry, Steve - Het Venetiaans bedrog.pdf 

我在/MarkLogic/conversion/actions/convert-pdf-action.xqy採取了外觀,但它不會成爲向我清楚我應該在哪裏添加一些代碼。

歡迎任何建議!

回答

2

由於您已經在使用CPF,因此您已經擁有屬性片段。我建議你保留這樣的信息,你可能想要作爲一個財產。同樣,您也可以在第一步中添加一個集合,並將其複製到上一步中每個新創建的文檔中。

這些方法可以與原始URI最終作爲一種類型歸類ID的

+0

感謝的任,我從來沒有意識到由CPF,源文件(原點URI)是已經在那裏創建這些屬性文件: ) – Thijs

+0

CPF使用屬性片段是爲什麼我在某些情況下不使用它。流水線中的3-4個步驟可能會以接近一打的提交結束,因爲狀態會作爲CPF所有更改屬性(這是事務性)的一部分進行更改。 這是一個很好的工具,但需要小心處理。 CPF的其他用途是用於將文檔添加到集合中,並將其像隊列一樣處理 - 然後使用cORB [2]來完成繁重的工作。 –