我想獲得關於如何建模以下反饋:MySQL的可擴展數據模型
- 兩個主要目標:收集和資源。
- 每個用戶有多個集合。我不保存用戶信息本身:每個集合都有一個「用戶ID」字段。
- 每個集合包含多個資源。
- 任何給定的集合只屬於一個用戶。
- 任何給定的資源可能與多個集合相關聯。
我致力於暫時使用MySQL,儘管可能會遷移到不同的數據庫中。我的主要擔憂是具有以下假設的可擴展性:
- 用戶數大約爲200,並且會增長。
- 平均而言,每個用戶有五個集合。
- 關於三萬個新的獨特的資源「消耗」日報:當資源被消耗,應用程序關聯該資源到每一個集合,是有關該資源。假設一個資源通常與約一半的集合相關,因此每天插入30,000 x(1,000/2)= 15,000,000個插入。
- 集合和資源對象都由大約六個字段組成,其中一些可能會達到100個字符的長度。
- 每個用戶都會持續進行輪詢以定期檢索其集合和相關資源 - 假設這種情況每分鐘發生一次。
請記住,我使用MySQL。鑑於預期的數據量,數據模型應該如何規範化?將這些數據存儲在一張平坦的表格中有意義嗎?什麼樣的分片方法是合適的? MySQL的NDB集羣解決方案是否適合這種用例?
「15,000,000插入」是一個巨大的變化。你真的是指「插入」?這是一個「主要插入」應用程序,主要是記錄事件? –