我試圖不使用複製命令,因爲它的數據庫是相當大的。我正在使用talend etl開源工具,但尚未找到任何解決方案。如何使用任何opensource etl工具將數據從postgres遷移到cassandra?
-1
A
回答
1
有3個最常見的數據遷移到Cassandra的選項:
1.自定義Spark工作。這需要一些編程,儘管它是最具可擴展性的解決方案,並允許您擁有任何自定義數據轉換邏輯。您可能需要數據轉換,因爲我無法想象您將擁有完全相同的RDBMS和鍵值存儲的表結構。
2.使用DataStax Enterprise軟件包中的sqoop(它包含Cassandra的自定義驅動程序)。
3.使用sqoop和Casasndra的JDBC驅動程序。雖然,我對上次Cassandra的JDBC驅動程序版本功能和穩定性沒有任何意見。我們在之前的版本中遇到了一些問題。
好的,有第四個。您可以編寫自己的數據簡單的獨立遷移工具(例如使用Java)。該工具將逐行讀取來自Postgres的數據並調用Cassandra的插入。這將會非常緩慢,雖然很簡單。
你已經提到過,數據庫非常大。但這只是意味着你必須等待更長時間直到遷移結束。這對於很多情況並不重要,確實如此。
CPU工作,而你可以做一些其他的事情。否則,當CPU放鬆時,你必須使用自己的時間。
1
如果您更喜歡Apache Spark,則可以使用Spark Cassandra Connector將DataFrame保存到Cassandra。關於如何使用PySpark連接Postgres,請參閱this question。
相關問題
- 1. 將數據從cassandra遷移到cassandra
- 2. 將數據從Cassandra遷移到MySQL的工具?
- 3. 將數據庫從Postgres遷移到MySQL
- 4. 使用EnterpriseDB遷移工具將MySQL數據庫遷移到PostgreSQL
- 5. Cassandra數據從1.2遷移到3.0.2
- 6. 如何將數據庫從mysql遷移到postgres
- 7. 如何將數據庫從Postgres遷移到MySQL?
- 8. 從postgres遷移/複製數據到vertica
- 9. 從Mysql到Cassandra的數據遷移
- 10. 使用Pentaho將數據從SQL/Oracle遷移到Cassandra
- 11. 任何工具將回購從Vault遷移到Subversion?
- 12. MySQL到Postgres數據遷移
- 13. 跨ETL工具在ETL作業上遷移
- 14. 將數據遷移到Heroku Postgres DB?
- 15. 如何將Cassandra 2.1.9的數據遷移到新的3.5安裝
- 16. 如何將數據從SQL Server 2008遷移/遷移到ORACLE 11g?
- 17. DocumentDB數據遷移工具,無法從數據庫遷移到db
- 18. 從RDBMS遷移到Cassandra
- 19. 從Mysql遷移到Cassandra
- 20. 如何使用Minion任務遷移進行數據庫遷移
- 21. 如何將oracle數據遷移到postgres中?
- 22. 從Cassandra 2.2.0遷移到DSE 4.8.5(Cassandra 2.1.3)
- 23. 有沒有辦法將Cassandra 1.2的數據遷移到Cassandra 1.1?
- 24. 遷移到MYSQL數據庫的工具
- 25. 任何好的Opensource Analytics前端工具?
- 26. 將所有數據從App Engine NDB遷移到Django模型Postgres
- 27. 如何使用cvs2svn工具從CVS遷移到SVN?
- 28. 將數據從Oracle遷移到Cassandra和/或MongoDB
- 29. 從mysql遷移到MongoDb,任何有助於創建遷移計劃的工具
- 30. Azure數據遷移工具
非常感謝! :) – Annie
@S。 Stas 有沒有什麼辦法可以達到上述目的,例如將Postgres轉儲文件轉換成Cassandra轉儲文件或其他東西。 –
好吧,從技術上講,您可以運行pg_dump並獲取sql命令列表。然後你可能需要用文本編輯器替換一些sql命令(對於Cassandra的特定版本)。不好的是,@Annie寫道,數據庫非常大。所以.sql文件會更大。所以COPY命令在這裏是更現實的輸入方式。 –