2014-09-29 29 views
0

我需要能夠做到以下幾點採用了Talend開放工作室:目的了Talend MDM服務器

  • 標準化和源數據的清洗。
  • 記錄的重複數據刪除。
  • 執行匹配和合並操作。
  • 數據的版本控制(我知道這可以使用SCD組件完成)。

是否可以使用Talend Open Studio進行數據集成來完成所有這些功能,還是我需要使用Talend MDM Server?

回答

2

作爲數據集成平臺,拓藍開放工作室,允許做的所有這些操作:

  • 標準化:定義標準架構,數據與這些映射規範架構
  • 源數據的清洗:審計在清理數據之前,您的具有Talend Data Quality的數據庫可能會很有趣。當您檢測到一些錯誤的記錄時,您可以繼續使用Talend Open Studio組件進行數據清理。
  • 重複記錄:結合tmap,tUniqRow和tAggregateRow可以解決重複的數據。
  • 匹配:tMap連接模型允許使用不同的連接模型(Inner/Outer join)匹配2個數據源之間的數據。您還可以使用模糊匹配技術來映射數據。
  • 合併:tAggregateRow允許合併已定義鍵列的數據。

根據您對「版本控制數據」的要求,SCD組件可以完成這項工作。

當您需要創建一個存儲庫來放置參考數據並在整個信息系統中使其可用(例如通過Web服務)時,可以使用Talend MDM服務器。