如果我想要使用太大而不適合內存的矩陣進行大量數據擬合,我會查看哪些工具/庫?具體來說,如果我通常使用php + mysql在網站上運行數據,那麼如何建議在合理的時間內執行大型矩陣操作的離線進程?Web數據上的大型機器學習
可能的答案可能就像「你應該用這種語言和這些分佈式矩陣算法來映射許多機器上的減少量」。我認爲php不是最好的語言,所以流程更像是其他離線進程從數據庫中讀取數據,進行學習,並將規則存儲回php中可以使用的格式(因爲該網站的其他部分是建立在PHP)。
不知道這是否是正確的地方問這個問題(在機器學習SE中會問這個問題,但它從來沒有超出測試版)。
機器學習已被交叉驗證合併。 – 2012-04-27 08:52:58