python-wise中實現predict_proba(X)等價的Scikit-Learn我更喜歡.predict_proba(X)而不是.decision_function(X),因爲它更容易解釋結果。就我所見,後者的功能已經在Spark中實現了(好吧,在版本0.9.2中,例如我必須自己計算點積,否則我得到0或1),但前者尚未實現(還!)。我該怎麼做\如何在Spark中實現那個呢?這裏需要的輸入是什麼以及公式如何?如何在MLlib
Q
如何在MLlib
1
A
回答
0
在Spark/Mlib 1.3版中,似乎預測函數可以通過清除閾值返回概率。 從這個頁面:https://spark.apache.org/docs/1.3.0/api/python/pyspark.mllib.html#module-pyspark.mllib.classification
>>> data = [
... LabeledPoint(0.0, [0.0, 1.0]),
... LabeledPoint(1.0, [1.0, 0.0]),
... ]
>>> lrm = LogisticRegressionWithSGD.train(sc.parallelize(data))
>>> lrm.predict([1.0, 0.0])
1
>>> lrm.predict([0.0, 1.0])
0
>>> lrm.predict(sc.parallelize([[1.0, 0.0], [0.0, 1.0]])).collect()
[1, 0]
>>> lrm.clearThreshold()
>>> lrm.predict([0.0, 1.0])
0.123...
if self._threshold is None:
return prob
else:
return 1 if prob > self._threshold else 0
我希望幫助。
相關問題
- 1. 如何在Scala Spark中獲得StratifiedKFold MLLib
- 2. 如何將Hive錶轉換爲MLlib LabeledPoint?
- 3. 如何提供Spark MLlib模型?
- 4. java apache spark mllib
- 5. Spark MLLIB問題
- 6. mllib KernelDensity錯誤
- 7. MLlib和pyspark功能
- 8. datastax,星火,和MLLIB
- 9. Spark mllib ALS建議
- 10. 結合Spark Streaming + MLlib
- 11. 如何在Spark MLLib中進行多目標線性迴歸?
- 12. 如何在Mllib中工作時保留記錄信息
- 13. 如何在web項目中使用spark mllib
- 14. 如何在PySpark中自定義估算器mllib
- 15. Spark MLLib如何在訓練分類器時忽略要素
- 16. 如何在CBOW模式下運行MLlib的word2vec?
- 17. 如何在Spark MLlib中執行基於用戶的建議?
- 18. 如何在數據庫中保存Spark MLlib模型?
- 19. 在Mac OS X上安裝Spark MLLib
- 20. OutOfBoundsException與ALS - 弗林克MLlib
- 21. mllib矢量的最大值?
- 22. 統計星火mllib DecisionTree
- 23. 從Spark上使用Breeze MLlib
- 24. Spark MLlib IDF洗牌數據?
- 25. 生成關鍵字和mllib
- 26. 與MLlib一起使用DataFrame
- 27. 火花mllib應用功能
- 28. 列星火MLlib變換
- 29. 星火MLlib 0.91 org.jblas.DoubleMatrix錯誤
- 30. Spark mllib洗牌數據