0

假設我有一個僱員表(擁有大約一百萬名員工)和一個任務表(具有幾百個任務)。將映射存儲在數據庫中的最佳方法

現在,我有一種機制來預測員工完成任務的可能性(百分比) - 假設我有四個這樣的機制,並且每個機制輸出它是自己的概率。

把它放在一起,我現在有n1(員工)時間n2(任務)時間n3(機制)結果存儲。

我想知道什麼是最好的方式來存儲這些結果。

我有幾個選擇和想法:

  • 保持在任的員工任務表列(JSONField) - 關注:如果有一個更新整列數據更改值

  • 維護第三表預測與外鍵員工塔斯ķ與存儲predicted_probability列 - 關注:是否必須存儲N1 N2 * N3 *記錄,我很擔心可伸縮性和性能

感謝您的幫助。

PS:我使用Django與Postgres的

+0

存儲過程分區表? – Tomm

+3

「預測」表是正確的方法。根據您訪問數據的方式,表格的大小無關緊要。例如我希望閱讀單個員工的預測具有相當穩定的表現。僅當需要處理所有行(或大部分行)時,大表往往會成爲問題。如果您在測試時遇到性能問題,您可以根據任務或任務和機制對錶進行分區(取決於您的查詢的結構) –

+0

感謝@a_horse_with_no_name的評論。 請將它添加爲答案,以便我可以將其標記爲已回答。 – anilkumarggk

回答

0

predictions表是要走的正確途徑。根據您訪問數據的方式,表的大小無關緊要。例如我希望閱讀單個員工的預測具有相當穩定的表現。僅當需要處理所有行(或大部分行)時,大表往往會成爲問題。如果您在測試過程中遇到性能問題,您可以通過任務或任務和機制(取決於您的查詢是如何結構化)

-Credits到也許@a_horse_with_no_name

相關問題