我可以使用訓練數據集構建Spark Kmeans模型。我想讓我的模型適應新的數據,所以Spark StreamingKmeans對我來說似乎很棒。使用靜態訓練數據初始化StreamingKmeans模型
但是,似乎Spark的StreamingKmeans只能在數據流中訓練。沒有辦法用默認的kmeans模型對其進行初始化,並根據一些靜態訓練數據進行訓練,然後隨着時間的推移對新的流入數據進行訓練。
是否存在使用靜態訓練數據在Spark中初始化KMeans模型的方法,並且使用StreamingKmeans對新數據進行隨時間訓練?