我們有不同的數據集到Hadoop,Cassandra,MongoDB等不同的系統中。但是我們的分析團隊希望從不同系統獲取拼接數據。例如,具有人口特徵的客戶信息將在一個系統中,他們的交易將在另一個系統中。分析應該能夠查詢獲取美國用戶的數據,交易量是多少。我們需要開發一個應用程序來提供與不同系統交互的簡易方法。什麼是最好的辦法?不同系統之間的大數據傳輸
另一個要求: 如果我們想提供自己的自定義的工作空間像MongoDB的一個系統,他們可以很容易地把它。按需將數據從一個系統提取到另一個系統的最佳策略是什麼?
任何指針或用來解決這類問題常見的架構將是很有益的。
這種方法有什麼主要優勢嗎?我的意思是,爲什麼要將相關數據存儲在不同的系統中? – Tariq