2016-05-30 153 views
1

我有一個R腳本,它用一堆tweets做東西,我想對同一個數據使用相同的腳本,但保存在Hadoop文件系統中。根據this Hortonworks教程,我可以使用R代碼和我的HDFS中的數據,但它不是很清楚。在hadoop和mapreduce上運行R腳本

通過使用這個Revolution R,我可以使用非常相同的R腳本,利用mapreduce範例嗎?我應該改變我的代碼還是有辦法執行爲Hadoop體系結構優化的相同功能? 我的願望是將我的代碼寫在R-Studio等標準R IDE上,然後在我的雲服務(例如Microsoft Azure)上使用它,或者使用它的大部分,並在基礎上使用mapreduce。

+0

我們就需要更多地瞭解你的腳本 - 很多的文本分析只是分裂和計算,這相對容易並行,但其他操作可能相當困難。 –

回答