2014-12-05 49 views
1

我使用Django來管理機器學習過程。在計算階段結束時,我剩下一個巨大的矩陣數據(大約50MB的浮點數)。我應該將它存儲在我的Django模型(二進制字段?)還是存儲在文件(FileField)中?這兩種選擇似乎有優點和缺點。Django:將巨大的矩陣存儲在表或文件中?

我的具體案例:我只需要在培訓完成後寫入數據,並在每次使用學習模型時將其加載到內存中。沒有查詢。只需讀取矩陣中的整個數據並在表格/文件中寫入矩陣。

回答

0

感謝您回覆!

我正在根據您的使用情況調整我的答案。

既然你只需要訓練後每次寫入數據時,你應該嘗試this

+0

感謝高塔姆,我覺得這是一個有點矯枉過正,是不是?我關心的不是速度或性能,我只是想存儲一個矩陣,問題是:在哪裏? (網上閱讀:「不要開始使用Redis或任何其他緩存,直到你需要速度 - 不要過早優化」) – Patrick 2014-12-05 18:56:44

+0

它的工作原理。我用分隔列的逗號來編寫數字,分隔行的分號。之後,我可以使用numpy.matrix(數據)將數據加載到矩陣中。我不知道它是否非常有效,但它的工作原理。謝謝高塔姆。 – Patrick 2014-12-05 20:43:19

+0

總是樂意幫助....請盡情享受 – 2014-12-06 03:53:34