我在學習Spring雲數據流的概念,並想知道存儲全局資源的常見方式是什麼。如何處理Spring雲數據流中的全局資源?
例如,當我有一個流與,我想通過春季雲任務定期重新訓練基礎pmml模型。
我在哪裏存儲模型,以便它可以作爲處理器的(只讀)資源使用,並且每天晚上由任務更新?春季雲數據流中是否存在全局存儲的概念? 我應該只使用Spring-Cloud之外的傳統數據庫還是有更好的方法?
我在學習Spring雲數據流的概念,並想知道存儲全局資源的常見方式是什麼。如何處理Spring雲數據流中的全局資源?
例如,當我有一個流與,我想通過春季雲任務定期重新訓練基礎pmml模型。
我在哪裏存儲模型,以便它可以作爲處理器的(只讀)資源使用,並且每天晚上由任務更新?春季雲數據流中是否存在全局存儲的概念? 我應該只使用Spring-Cloud之外的傳統數據庫還是有更好的方法?
在Spring雲數據流本身中沒有共享存儲的一般概念,但用於爲PMML處理器提供模型的Spring Resource
非常靈活(請參閱http://docs.spring.io/spring/docs/current/spring-framework-reference/html/resources.html,特別是表8.1中的幾個路徑選項用於參數pmml.model-location
)。所以有幾個選項開箱:
file://
協議來訪問然後);附加選項(其需要包括在應用程序中附加的罐)可用於S3(經由https://cloud.spring.io/spring-cloud-aws/)和HDFS(通過Spring爲Apache Hadoop的 - 見http://docs.spring.io/spring-hadoop/docs/current/reference/htmlsingle/#using-hdfs-resource-loader)。