2011-06-08 78 views
5

我正在學習python和django。我需要爲數據解析,統計,AI和數據挖掘做大量的工作。有很多可用的庫。所以我想知道我應該學習哪些SET。目前我的心中有以下SET。我應該學習AI和數據挖掘的東西的哪一套python庫

  • 解析:美麗的湯
  • 搜索引擎:嗖(它將抓取和索引網站或沒有?)
  • AI:PyBrain
  • 數據挖掘:橙色(我不知道這個回合,別的)

所以我想知道還有什麼我需要學習的領域。 或某些人試過的圖書館。基本上我想要從Django內部使用的庫,我不希望這些庫有不同的框架。

回答

1

除了由@aix引scikit,你可能想看看以下庫:

  • mlpy,一個ML庫進行預處理,聚類,預測分類,迴歸和特徵選擇。
  • PyML,又一個ML庫。
  • pandas(Pythonic截面,時間序列和統計分析)是一套基於NumPy的快速數據結構,針對面板,時間序列和橫截面數據分析進行了優化,重點放在計量經濟學應用上。
  • scikits.statsmodels,實現了常用的統計模型(OLS/GLS,GLM,M-估計等)。我真的很喜歡這個軟件包,語法很乾淨,感覺就像我們沒有離開R.

我真的第二次調查橙色功能,這是一個功能齊全的數據挖掘應用程序,但您可以致電它來自外部腳本,參見例如Beginning with Orange教程得到一個想法。

2

我發現你的要求有點模糊,但你可能想看看scikits.learn

+0

感謝您的建議。我正在尋找這:) – 2014-05-04 17:51:55