2011-06-06 39 views
0

我完全不熟悉數據分析,並想知道是否有人對如何啓動有任何建議?分析mysql數據

這是我想解決的問題。我有一個mysql數據庫,每天從20行到每天增加數百萬行(取決於數據源),我想分析它的關係。基本上它是數據組合的可能性(紅色= 2,藍色= 5,黑色= 5等),我想要一個工具來日常分析它,看哪些是最有可能的(即如果我把約束只有5%的總價值可以改變或只有5種顏色可以選擇)。

我認爲這將會很複雜,但我是新的,完全願意學習。對於上述問題(以及相關類型的分析問題),您建議我做什麼?我正在尋找一個工具(開源請...我是一個可憐的學生),一本書的建議,howto doc等。我想要一個良好的基礎,這不是生產(這是一個學習環境,我設置所以我可以試驗)。

我正在學習python和java,並且正在考慮使用這些工具進行分析,但朋友建議可能使用爲其設計的工具或遵循經過驗證的方法來做到這一點。

回答

1

你對實際的細節很輕。但是如果你正在尋找開源統計分析軟件包,我會建議從r,wekaknime開始。當然,這是一個非常重要的主題。

根據你的理解水平,人們可以使用SQL來做很多事情,但不知道你的數據結構,它代表什麼以及你想要完成什麼,沒有任何東西試圖解釋你能做什麼。

對於你提到的學習Python和Java,這也將是有益的。兩者都有幾個可用的開源統計軟件包,並且/或者可以與我上面列出的程序捆綁在一起。