我在MySQL中構建了一箇中等大小(100,000條目)的表,我試圖優化它的速度。這些條目包含一些事務性數據,這些數據顯然會保存在MySQL中。其餘的數據在表的生命週期中不會改變,也不適合表格格式(即一些條目將包含其他條目不會的字段,導致很多'空'值)。此外,第二部分的大部分數據都會重複,這意味着可能只有500-1000個獨特的數據集,然後與表中的條目配對。大數據量重複數據的MySQL數據庫優化
我在考慮三種組織數據的方法。 1)以表格格式保留MySQL中的所有數據。 2)序列化非唯一數據並將數據保存在單個MySQL字段中。 3)序列化非唯一數據並保存到硬盤中的文件中,由MySQL表中的指針引用。
我的問題是你會推薦哪種格式,爲什麼?考慮到我將在數據庫上運行很多查詢,哪一個會最快?
數據的例子會有很大的幫助。最重要的問題是:「你打算如何使用它?」 –
也許一個更簡單的方法是,表中的每個條目都是更大類型對象的子類。我將存儲MySQL中子類實例所特有的所有變量,因爲我需要頻繁搜索和更新這些變量。但是我還需要讀取(而不是寫入)對大類擁有的變量的訪問。 –
例如,我有對象A,B和C.條目1,2,3,4和5是A,B和C的實例,其中1-> A,2-> A,3-> B, 4→B和5→C。存儲所有A實例共有的數據的最佳方式是什麼? –