2017-03-30 59 views
-1

我是新來的機器學習領域,我計劃使用python作爲編程語言來實現算法和Java的系統架構。關於沒有Matlab的機器學習工具集的建議

據我所知,機器學習更多的是建立特定於域的數據,可視化數據,並選擇合適的模型&參數。實現模型/算法是最後一個相對簡單的步驟。

Matlab似乎擁有機器學習的一切,但它太昂貴,需要學習一門新的語言。

除了編程語言,我還需要什麼工具來進行企業項目的機器學習?例如數據建模,可視化等

+0

這太寬泛了,可能是針對SO規則的問題。不用擔心...很久很久以前,Python在ML方面超過了Matlab(在功耗方面,可能不是易於使用;是的,尤其是因爲所有相關庫的核心算法都是用Fortran,C,C++編寫的;其中許多甚至與Matlab中使用的相同)。我不確定你的系統架構是什麼意思,但我相當有信心python也可以代替java。 – sascha

+0

嗨sascha,謝謝你的提醒。我的意思是系統架構是算法實現以外的其他任何東西,比如數據倉庫,分佈式系統,微服務等。 – Jay

回答

2

經過幾年的試驗和錯誤,我建議你直接用python,可能用scikit-learn或tensorflow(如果你想去核心:)。

我也在過去試過R,雖然它是一種非常有效的語言,但它有一些限制:默認情況下它是單線程的,雖然有解決方案,但它們不像Python那樣乾淨。另外,python似乎是機器學習的語言,它很容易學習,而且速度快(取決於當然的解釋器實現),也有huuuuuuge支持,很多教程,文檔和更多重要的是,圖書館正在積極發展和支持。最後,我建議你考慮Spyder作爲數據科學的好IDE,我也嘗試過Rodeo,但它並不像Spyder那樣成熟穩定。

希望這會有所幫助。

+0

謝謝。數據建模和可視化呢? – Jay

+0

,併爲此感到抱歉。我的問題是要求除編程語言之外的工具,工具來幫助可視化數據,選擇合適的模型,並測試我的模型。 – Jay

+1

關於數據建模,再次,scikit-learn將會完成大部分工作。添加numpy和熊貓,並完成。根據可視化,matplotlib做到了。此外,scikit-learn還附帶了一套很好的指標來評估你的模型有多好(精確,回憶,f1 ...) –