我們正試圖弄清楚如何在GCP中託管和運行我們現有的許多scikit-learn和R模型。看起來ML Engine對於Tensorflow非常特殊。如何在Google雲平臺上訓練scikit-learn模型並在數據集太大而無法使用datalab時管理我的模型?我仍然可以使用ML引擎,或者大多數人採用不同的方法嗎?管理Google雲端平臺中的scikit-learn模型
作爲一個更新,我能夠通過將scikit-learn模型作爲培訓工作提交給ML引擎來獲得運行scikit-learn模型的python腳本,但沒有找到一種方法來容納pickled模型或將其用於預測。
這取決於你的用例。什麼是大數據集?如果讓實例變大,它是否可以放入datalab實例的內存中?這是最簡單的解決方案。如果沒有,可能是時候看看更適合的工具 - 比如TF Learn,或者Spark MLlib。 –