2011-12-27 26 views
-1

我是一個狂熱的python用戶,我的主要興趣恰好是機器學習。 大多數情況下,我在Python中使用python中的MySQL包(mysqldb)來完成這些工作。 而事情看起來不錯..但現在我正在步入被稱爲「大數據」的領域。 你有什麼建議可以讓我開始使用Hadoop或Mahout Hadoop。 大多數情況下,我有我的機器學習庫,我已經建立了一段時間.. 所有在python中。 我可以在Hadoop上運行它嗎?我希望這個問題是有效的..或者如果不是。 那麼什麼是Hadoop?你如何使用hadoop .. Python用戶

我可以使用自己的筆記本電腦進行開發嗎? 如何一個建立在Hadoop或數據什麼都EC2實例等等等等 感謝

編輯:

我的主要問題是關於數據庫。 在正常情況下,你有一個在你的本地mysql或服務器配置中設置的數據庫...這就是你的數據所在......你使用mysql查詢來獲取數據,然後用數據..你做了很多東西..cool..right .. :)

但是,如果我必須使用hadoop ..(或mahout hadoop),我可以在哪裏保存數據..我一直在關注雲計算..我是否需要買空間某處的東西來開始.. ?? 如何從數據庫中獲取數據?

+1

FRAZ avaliable,您可能希望以足夠一般的方式改寫您的問題,使其適用於其他方面ERS。規範鏈接:[問]。 :) – mac 2011-12-27 19:23:29

回答