0

我在學習Spring雲數據流的概念,並想知道存儲全局資源的常見方式是什麼。如何處理Spring雲數據流中的全局資源?

例如,當我有一個流與​​,我想通過春季雲任務定期重新訓練基礎pmml模型。

我在哪裏存儲模型,以便它可以作爲處理器的(只讀)資源使用,並且每天晚上由任務更新?春季雲數據流中是否存在全局存儲的概念? 我應該只使用Spring-Cloud之外的傳統數據庫還是有更好的方法?

回答

1

在Spring雲數據流本身中沒有共享存儲的一般概念,但用於爲PMML處理器提供模型的Spring Resource非常靈活(請參閱http://docs.spring.io/spring/docs/current/spring-framework-reference/html/resources.html,特別是表8.1中的幾個路徑選項用於參數pmml.model-location)。所以有幾個選項開箱:

  • 使用一個共享文件系統(其可以通過file://協議來訪問然後);
  • 將模型存儲在可訪問的位置,可通過HTTP作爲靜態資源提供服務;

附加選項(其需要包括在應用程序中附加的罐)可用於S3(經由https://cloud.spring.io/spring-cloud-aws/)和HDFS(通過Spring爲Apache Hadoop的 - 見http://docs.spring.io/spring-hadoop/docs/current/reference/htmlsingle/#using-hdfs-resource-loader)。