堅持和重複使用經過訓練的機器學習模型的任何建議/最佳實踐?我正在用Python或R開發模型。然後,這些模型必須用於評分生產工作流程(其中R不可用)。例如,可以在R中訓練一個邏輯迴歸模型。現在需要根據這個模型對新的觀察結果進行評分。評分引擎必須快速且可擴展。我想過以下機器學習模型持久性選項
PMML(http://en.wikipedia.org/wiki/Predictive_Model_Markup_Language)。很容易將R中開發的大多數模型轉換爲pmml。但是,我找不到PMML模型的有用評分引擎。例如,有augustus(https://code.google.com/p/augustus/),但它只實現了3-4個模型。
在Python中使用pickle序列化模型,並使用Python編寫消費者。
有關正確方法的任何想法/建議?
您需要使用哪種型號? – pacoid
@ pacoid:主要回歸模型(線性和邏輯)和基於樹的模型。 – hssay