2012-12-05 80 views
2

我們使用RevoRrmrrhadoop package。我們可以對整個數據在Hadoop中集進行線性迴歸,而無需實現在地圖中的線性迴歸算法降低使用R和Hadoop進行Logistic迴歸

是RMR和rhadoop,只是用於彙總的數據,然後在運行迴歸在本地彙總數據?

回答

0

都沒有。您可以在rmr中實現任何類型的算法,而不僅僅是摘要。然而,它不是一個算法包,因爲它不包括線性迴歸或集羣或任何類型的東西,就像包或平行或雪。

+0

謝謝。所以我們基本上需要手動編寫代碼來適應迴歸模型?例如,計算平均值,計算成本函數,應用梯度下降等等? – Victor

+0

我這麼認爲。可能存在某些問題,只能在映射器中計算獨立解決方案,然後在縮小階段合併它們。這種方法工作的一個例子是函數max:取任意子集的最大值,然後取最大值的最大值。對於平均值,只要權重適當,就可以做平均值的手段。對於線性迴歸,我不確定。 – piccolbo