假設我有一個僱員表(擁有大約一百萬名員工)和一個任務表(具有幾百個任務)。將映射存儲在數據庫中的最佳方法
現在,我有一種機制來預測員工完成任務的可能性(百分比) - 假設我有四個這樣的機制,並且每個機制輸出它是自己的概率。
把它放在一起,我現在有n1(員工)時間n2(任務)時間n3(機制)結果存儲。
我想知道什麼是最好的方式來存儲這些結果。
我有幾個選擇和想法:
保持在任的員工或任務表列(JSONField) - 關注:如果有一個更新整列數據更改值
維護第三表預測與外鍵員工和塔斯ķ與存儲predicted_probability列 - 關注:是否必須存儲N1 N2 * N3 *記錄,我很擔心可伸縮性和性能
感謝您的幫助。
PS:我使用Django與Postgres的
存儲過程分區表? – Tomm
「預測」表是正確的方法。根據您訪問數據的方式,表格的大小無關緊要。例如我希望閱讀單個員工的預測具有相當穩定的表現。僅當需要處理所有行(或大部分行)時,大表往往會成爲問題。如果您在測試時遇到性能問題,您可以根據任務或任務和機制對錶進行分區(取決於您的查詢的結構) –
感謝@a_horse_with_no_name的評論。 請將它添加爲答案,以便我可以將其標記爲已回答。 – anilkumarggk