我有一個數據集,自1998年以來有1分鐘1000股的數據,總計約爲(2012-1998)*(365*24*60)*1000 = 7.3 Billion
行。如何存儲73億行市場數據(優化後可讀取)?
大部分(99.9%)的時間我只會執行讀取請求。
將數據存儲在數據庫中的最佳方式是什麼?
- 1個7.3B行的大表?
- 1000個表格(每個股票代碼一個)每個有7.3M行?
- 數據庫引擎的任何建議? (我正計劃使用Amazon RDS的MySQL)
我不習慣處理這麼大的數據集,所以這是一個很好的學習機會。我會很感激你的幫助和建議。
編輯:
這是一個示例行:
'XX',20041208,938,43.7444,43.7541,43.735,43.7444,35116.7,1,0,0
第1欄是股票代號,第2欄是日期,第3欄是分鐘,其餘是開高 - 低收盤價,成交量和3個整數欄。
大部分的查詢會像「給我AAPL的價格2012年4月12日12:15和2012年4月13日12:52之間的」
關於硬件:我打算使用Amazon RDS讓我」 m靈活
描述預期的典型查詢 – 2012-03-22 01:30:40
「我認爲你應該使用MongoDB,因爲它的網絡規模。」 – 2012-03-22 01:31:41
您可能需要一張大桌子,由股票代碼分割。 – 2012-03-22 01:32:10