大數據量重複數據的MySQL數據庫優化

我在MySQL中構建了一箇中等大小（100,000條目）的表，我試圖優化它的速度。這些條目包含一些事務性數據，這些數據顯然會保存在MySQL中。其餘的數據在表的生命週期中不會改變，也不適合表格格式（即一些條目將包含其他條目不會的字段，導致很多'空'值）。此外，第二部分的大部分數據都會重複，這意味着可能只有500-1000個獨特的數據集，然後與表中的條目配對。大數據量重複數據的MySQL數據庫優化

我在考慮三種組織數據的方法。 1）以表格格式保留MySQL中的所有數據。 2）序列化非唯一數據並將數據保存在單個MySQL字段中。 3）序列化非唯一數據並保存到硬盤中的文件中，由MySQL表中的指針引用。

我的問題是你會推薦哪種格式，爲什麼？考慮到我將在數據庫上運行很多查詢，哪一個會最快？

來源

2013-08-18 Michael.Lumley

數據的例子會有很大的幫助。最重要的問題是：「你打算如何使用它？」 –

也許一個更簡單的方法是，表中的每個條目都是更大類型對象的子類。我將存儲MySQL中子類實例所特有的所有變量，因爲我需要頻繁搜索和更新這些變量。但是我還需要讀取（而不是寫入）對大類擁有的變量的訪問。 –

例如，我有對象A，B和C.條目1,2,3,4和5是A，B和C的實例，其中1-> A，2-> A，3-> B， 4→B和5→C。存儲所有A實例共有的數據的最佳方式是什麼？ –