我們在RDS中有幾個mySql表,這些表很大(超過700 GB),我們希望遷移到DynamoDB表。你能提出一個策略,或者以一種乾淨的,並行的方式來做到這一點?也許使用EMR或AWS Data Pipeline。需要將大型表從RDS遷移到DynamoDB的策略建議
回答
您可以使用AWS Pipeline。有兩個基本模板,一個用於將RDS表移至S3,另一個用於將數據從S3導入DynamoDB。您可以使用這兩個模板創建自己的管道。
問候
有一點要考慮這樣的大數據是迪納摩是否是最佳的選擇。
如果這是統計數據或其他「大數據」,請查看AWS RedShift,它可能更適合您的情況。
我們需要切換到非規格化的無模式表以適應某些用例,因此對於我們來說,Dynamo是更好的選擇。 –
@AnkitKapur - 如果你可以爲你的數據選擇一個好的散列鍵,那麼Dynamo是唯一不錯的選擇!請閱讀文檔,並確保您瞭解Dynamo的限制和最佳做法,然後再使用該路線。 –
我們已經做了類似的工作,可能有更好的策略來做到這一點。在源實例中使用AWS DMS和一些準備表。
它涉及到兩個步驟:
你建立一個源代碼實例中新表與dynamodb的模式匹配,到底是哪。如將多個表合併爲一個等。
設置DMS任務,準備表作爲源,DynamoDB作爲目標。由於準備表和目標模式現在相匹配,所以從這一點來看,它應該是非常簡單的。
希望幫助!祝你好運!!
- 1. 傳統應用程序遷移策略 - 策略需要的建議
- 2. Django緩存策略需要的建議
- 3. 從oracle遷移到cassandra需要考慮什麼策略
- 4. 需要一些關於從Motif遷移到Gtk的建議
- 5. 從SQL 2000遷移到SQL 2008的遷移策略
- 6. 大型MySQL表 - 需要建議
- 7. rails數據和模型遷移策略
- 8. 遷移到團隊系統的策略
- 9. Struts1到Struts2的遷移策略
- 10. 將大型SQL表遷移到SQL azure
- 11. 從Veracity遷移的建議?
- 12. 我需要大型網站的建議
- 13. 將分支策略從ClearCase遷移到TFS 2010
- 14. 那就需要花多少時間將數據從DynamoDB遷移到S3
- 15. 在大型表上運行ALTER遷移的建議
- 16. NonUniqueObjectException遷移到hilo生成器策略
- 17. 學說2繼承映射策略需要的建議
- 18. 需要關於發佈管理策略的建議或指導
- 19. 將數據從電子表格遷移到RDBMS的策略是什麼?
- 20. DynamoDB主鍵策略
- 21. 多人UDP網絡策略,需要建議
- 22. 使用Javascript - 策略模式建議需要
- 23. 將postgres轉儲遷移到RDS
- 24. 遷移到Amazon SQL Server RDS
- 25. 我們可以將Teradata遷移到DynamoDB
- 26. 從MVC2遷移到MVC3 /剃鬚刀的策略
- 27. 在SAP上下文中從php遷移到java的策略
- 28. 從ClearCase遷移到SVN的最佳策略是什麼?
- 29. 從Amazon RDS(MySql)遷移到Heroku Postgres需要付出多少努力?
- 30. VB6遷移建議
謝謝,如果我們可以使用這些模板,那將是完美的,但我們有** 2個mySQL表**,我們希望將其存儲爲** 1個單獨的DynamoDB表**。這些模板有用於處理單個表格的選項,但不包括2.是否有解決此問題的方法,這不涉及預處理? (這將是我們的最後手段 - 將2個mySQL表加入一個mySQL表,因爲它需要很多時間和空間) –
嗨Ankit。在這種情況下,您需要在管道中包含EMR集羣。工作流程應該是:將兩個表格以分開的csv移動到S3,EMR集羣將合併/連接表並將輸出轉到S3,最後將數據導入到DynamoDB。在這裏,您需要爲合併/合併作業開發一點點。使用Hadoop命令可輕鬆導入/導出到EMR中的S3。 – AGL