1
我有一個關於設置我的表來處理我每天導入的大量數據的最佳方法的一般問題。 我將每天導入10個包含1000條記錄的csv文件,以便此錶快速擴展。大量數據導入的表結構
它由15列組成,從小到中等整數到30個字符的變化。
沒有ID字段 - 我可以加入6列,以形成一個主鍵 - 這將是一個變種焦炭總長度約45
當它的進口我需要通過一個Web前端該數據報告以摘要級別結束,因此我看到自己必須在導入後從此生成報表。
在這個數據中有很多領域在每一天的進口 - 日期,地區,客戶等重複自己,每天只有一半列是特定於記錄。
問題:
- 我應該導入所有到一個表作爲立即轉儲表。
- 我應該通過導入過程轉換數據和拆分到不同的表進口
- 我應該形成基於列的id字段我可以進口
- 我應該使用自動INC期間獲得一個唯一的密鑰id字段爲此。
- 這應該是什麼樣的表的InnoDB等
我擔心的是在這個表上,這將使提取到報告表難當,因爲它建立數據超載?
建議真的很有幫助。謝謝。
感謝 - 好點 - 我想我會發現很難在導入時添加id,這是主要問題。我看不出我該如何在邏輯上分解csv數據,並且能夠將生成的id用作表中的外鍵,我也在轉換過程中添加了這些外鍵。 我認爲你肯定是歸檔的東西。 – user1479891 2013-02-11 10:00:13