我正在將manifoldcf或mcf與alfresco cms集成爲使用CMIS查詢並使用solr作爲存儲所有索引的輸出通道的存儲庫連接器。我能做得很好&可以在索引索引中搜索文檔。ManifoldCF作業調度如何運行?
現在作爲實現的一部分,我打算引入多個存儲庫,如sharepoint,文件系統等,所以現在我有三個文檔存儲庫:alfresco,sharepoint &文件系統。我打算計劃通過每個存儲庫運行的作業,並按特定間隔抓取這些作業。但我有以下爭論。
- 我雖然調度頻繁的工作,我想確保MCF工作只挑其中要麼添加了新的或更新的說,這些內容我有100個文檔DRING目前的工作運行,但在接下來的工作運行說110所以我只想運行新的10個文檔而不是整個110個文檔的作業。
- 由於可用的mcf教程相對較少,我無法確保mcf作業以這種方式運行,但我認爲它足夠智能以表現這種方式,但再次沒有證據證實它。
- 我想了解更多關於mcf作業調度類型的信息:每次掃描一次文檔/直接重新掃描文檔。同樣,我想了解更多關於工作調用的信息:complete/minimal。我會爲成爲新手而感到抱歉。
- 另外我正在考慮做一些自定義編碼,以確保只有最新的/更新的文檔纔有資格進行處理,但再次只能通過代碼來獲取更少的文檔。
- 在這種情況下doc定製編碼是明智的還是mcf提供所有這些功能OOTB。
非常感謝提前。