將映射存儲在數據庫中的最佳方法

假設我有一個僱員表（擁有大約一百萬名員工）和一個任務表（具有幾百個任務）。將映射存儲在數據庫中的最佳方法

現在，我有一種機制來預測員工完成任務的可能性（百分比） - 假設我有四個這樣的機制，並且每個機制輸出它是自己的概率。

把它放在一起，我現在有n1（員工）時間n2（任務）時間n3（機制）結果存儲。

我想知道什麼是最好的方式來存儲這些結果。

我有幾個選擇和想法：

保持在任的員工或任務表列（JSONField） - 關注：如果有一個更新整列數據更改值
維護第三表預測與外鍵員工和塔斯ķ與存儲predicted_probability列 - 關注：是否必須存儲N1 N2 * N3 *記錄，我很擔心可伸縮性和性能

感謝您的幫助。

PS：我使用Django與Postgres的

存儲過程分區表？ – Tomm

「預測」表是正確的方法。根據您訪問數據的方式，表格的大小無關緊要。例如我希望閱讀單個員工的預測具有相當穩定的表現。僅當需要處理所有行（或大部分行）時，大表往往會成爲問題。如果您在測試時遇到性能問題，您可以根據任務或任務和機制對錶進行分區（取決於您的查詢的結構） –

感謝@a_horse_with_no_name的評論。請將它添加爲答案，以便我可以將其標記爲已回答。 – anilkumarggk

的predictions表是要走的正確途徑。根據您訪問數據的方式，表的大小無關緊要。例如我希望閱讀單個員工的預測具有相當穩定的表現。僅當需要處理所有行（或大部分行）時，大表往往會成爲問題。如果您在測試過程中遇到性能問題，您可以通過任務或任務和機制（取決於您的查詢是如何結構化）

-Credits到也許@a_horse_with_no_name

2017-10-05 11:04:41 Tomm

回答