2012-12-04 121 views
1

我有成百上千的文件系統當前存儲的PDF文件。我有一個自定義應用程序,作爲事後的實際目的,提供對這些PDF的訪問。我想從自定義應用程序中取出「存儲&檢索」部分,並使用OpenSource文檔存儲後端。使用REST API的PDF存儲系統

訪問PDF商店應該通過REST API,以便用戶不需要自定義客戶端來進行基本的文檔瀏覽和查看。存儲PDF的程序也應該能夠通過REST API工作。他們會提供實際的二進制或ASCII數據以及稍後可用於檢索的結構化元數據。

一個典型的檢索查詢將是「給我所有在文檔類型A或B的天X和Y之間創建的文檔」。

我的研究,無論是否存在這樣的存儲後端,都已經空了。你們中的任何人都知道提供這些功能的系統嗎?開源首選,價格合理的系統考慮。

我不是在尋找關於如何使用可用技術「滾動我自己」的建議。相反,我試圖找出是否可以避免。提前謝謝了。

回答

0

您所描述的聽起來像是一個文件管理或資產管理系統,其中有很多;而許多使用PDF文件。對於像Xinet這樣的商業產品(http://www.northplains.com/xinet - 現在明顯地獲得)或Elvis(http://www.elvisdam.com),我有一些短暫的經驗。兩者都可能符合您的要求,但它們可能太大而且可能太貴。

你看過Alfresco嗎?這是一個開放源代碼的替代品,我在幾年前與一個遴選委員會的董事會進行接觸。據我記得,它肯定會朝着你所尋找的方向發展,它是開源的,所以也可能適合這個角度:http://www.alfresco.com

+0

我的想法是,使用全面的內容管理系統只是爲了存儲非結構化的PDF可能是矯枉過正的。然而,根據你的回答,我檢查了Alfresco,發現它不僅提供了一個REST API,而且還有一個叫做CMIS的標準。更重要的是,Apache有一個叫做化學的CMIS實現,這個實現看起來比Alfresco要精簡得多。這看起來很有前途,非常感謝你的回答。 – ulim