在瞭解了MapReduce解決計算機視覺問題之後,我最近在Google實習期間,我感覺自己像一個開明的人。我一直在使用R進行文本挖掘。我想使用R進行大規模文本處理和主題建模實驗。我開始閱讀教程,並從事其中一些工作。我現在就放下我的每個工具的認識:通過R瞭解R-Hive,Elastic MapReduce,RHIPE和Distrubted Text採用R
1)R文本挖掘工具箱:意味着本地(客戶端)的文本處理,它使用XML庫
2)蜂巢:Hadoop的Interative的,提供調用map/reduce的框架,並提供用於在DFS上存儲文件的DFS接口。
3)RHIPE,R Hadoop的集成環境
4)彈性MapReduce與R:對於那些MapReduce框架沒有自己的集羣
5)分佈式文本挖掘有R誰:嘗試使無縫移動形式的本地服務器側處理,從R-TM到R-分佈式-TM
我對上述包裝
1)蜂房和RHIPE和分佈式文本MI下列問題和困惑寧工具箱需要你有你自己的集羣。對?
2)如果我有一臺電腦怎麼會在DFS HIVE
3)的情況下工作,我們是與上述包裝重複勞動的問題,面對?
我希望能得到上述問題的見解,在未來的幾天