2017-05-25 95 views
1

Spark ML LinearRegression似乎對單個標籤倒退。如何在Spark MLLib中進行多目標線性迴歸?

LabeledPoint(label: Double, features: Array[Double]) 

https://spark.apache.org/docs/0.8.1/api/mllib/org/apache/spark/mllib/regression/LabeledPoint.html 

但是,與我的問題,我需要預測矢量

例如

LabeledPoint(label: Array[Double], features: Array[Double]) 

有沒有辦法讓我這樣做? (這是在sickit學習支持,我試圖做火花)

ps 1:如果這是不可能的MLLib直接,有沒有關於如何從頭開始使用火花實現這個教程?

ps 2:我的輸出標籤是一個60元素的向量。所以我可以運行LinearRegression 60次,然後運行60個預測來預測。但這似乎是一個破解

+0

您是否找到針對該問題的解決方案? – constructor

回答

0

從我所知道的沒有本地實現,但如果你看看scikit-learn的實現Multioutput regression它說「策略包括爲每個目標擬合一個迴歸器」,因爲每個目標由恰好一個迴歸者表示,通過檢查其相應的迴歸者可以獲得關於目標的知識「。

這意味着潛在的實現可能是並行化每個目標的迴歸步驟。然後,您可以同時分配計算來加快速度。