2011-10-13 30 views
2

通常人們如何在數據倉庫中執行登臺步驟?數據倉庫中的分段步驟?

我必須做一個類似的任務,我不知道,如果使用NoSQL數據庫將數據集成的目的一個不錯的選擇,有多少簡單而有效的將是進行數據清理和擦洗

有有人在這方面做了一些工作?

請讓我知道

道歉通用的問題,但並沒有拿出一個更好的地方要問這樣的問題比SO

謝謝

+0

什麼是您的源數據?目前我還不熟悉NoSQL數據庫。但我猜你的源數據是一些RDBMS或其他類型的表格數據。如果是這樣,爲什麼甚至將NoSQL作爲選項進行評估? –

回答

1

對於數據清理以及ETL你希望獲得最豐富的查詢功能,這通常不被視爲NoSQL數據庫的優勢。在大多數情況下,用數據倉庫系統的傳統RDBMS平臺可能會更好。

0

對於Staging區域,您可能需要一個強大的RDBMS平臺。我已經使用了Teradata,並且它是迄今爲止可用的最好的RDBMS之一,因爲它允許查詢的並行執行,並且它具有非常高的性能。