2014-05-23 36 views
0

我目前在探索Tera數據Aster(Aster express 6)。我已經通過文檔和博客,但沒有解釋如何查詢作品。 ,因爲它是如何分配他們的SQL和SQL-MR取數據,他們是否在內部生成地圖縮減作業?SQL和SQL-MR查詢如何在Teradata內部工作?

例如客戶表有10條記錄,這些記錄是散列(客戶id)分佈的,並且說他們是3名工人(除了asterdata中的節點外),數據在兩個節點上分爲3條記錄,節點。

在SQL 客戶簡單的SELECT *;將在這種情況下工作?

但在ASTER數據這個查詢工作。

它是如何獲取從3個節點記錄?如果普通的sql查詢可以記錄記錄,那麼爲什麼我們需要MapReduce,我們可以使用多重子查詢來完成任務?

如果數據分佈在多臺機器上,那麼mapreduce是處理數據的唯一方法?

這將真正幫助我,如果有人解釋說這個!

Pradi

+1

並行和分佈式數據庫的主題看起來對於堆棧溢出問題來說太廣泛了。 –

回答

1

www.teradata.com/white-paper/Using-SQL-MapReduce-for-Advanced-Analytical-Queries/是Teradata的贊助的白皮書,闡述其基本原理結合MapReduce的SQL一起,並且應該是提高理解的良好開端。