1

我們正試圖弄清楚如何在GCP中託管和運行我們現有的許多scikit-learn和R模型。看起來ML Engine對於Tensorflow非常特殊。如何在Google雲平臺上訓練scikit-learn模型並在數據集太大而無法使用datalab時管理我的模型?我仍然可以使用ML引擎,或者大多數人採用不同的方法嗎?管理Google雲端平臺中的scikit-learn模型

作爲一個更新,我能夠通過將scikit-learn模型作爲培訓工作提交給ML引擎來獲得運行scikit-learn模型的python腳本,但沒有找到一種方法來容納pickled模型或將其用於預測。

+0

這取決於你的用例。什麼是大數據集?如果讓實例變大,它是否可以放入datalab實例的內存中?這是最簡單的解決方案。如果沒有,可能是時候看看更適合的工具 - 比如TF Learn,或者Spark MLlib。 –

回答

1

Cloud ML引擎僅支持使用TensorFlow編寫的模型。

如果您正在使用scikit-learn,您可能需要查看一些更高級別的TensorFlow庫,如TF LearnKeras。他們可能會幫助您將模型遷移到TensorFlow,在這種情況下,您可以使用Cloud ML Engine。

0

Cloud ML有可能從2017年12月開始提供此功能,截至今日,它已作爲早期訪問提供。基本上Cloud ML團隊正在測試這個功能,但你也可以成爲它的一部分。更多關於here

使用以下命令將scikit-learn模型部署到cloud ml。請注意,這些參數將來可能會發生變化。

gcloud ml-engine versions create $ {MODEL_VERSION} --model = $ {MODEL} --origin =「gs:// $ {MODEL_PATH_IN_BUCKET}」--runtime-version =「1.2」--framework = 「SCIKIT_LEARN」