2014-10-06 57 views
0

我有幾個問題。瞭解分佈

  1. 我想知道我們是否需要擔心Netezza在使用select語句(而不是創建表)時的分佈。 我基本上試圖通過連接到Netezza並選擇有幾個連接的視圖來創建SAS中的數據集。我想知道這將如何影響Netezza的性能,如果我直接在SAS中創建表。

  2. 我正在通過連接customer_id上的另外兩個表來創建表。但是,輸出數據集不包含customer_id作爲列。我可以在customer_id上分發這張表嗎?

謝謝。

回答

0

對於第一個問題,如果不創建表格,通常不需要擔心分佈。它有助於理解您正在選擇的表的分配方法,但它當然不是必需的。有一個支持你正在做的特定連接的分佈方法當然可以幫助選擇期間的性能(例如,如果你的連接列是分佈列的超集,那麼你將獲得同位連接),但是如果輸出的目標是SAS,那麼將數據集的寫入寫入SAS沒有影響。

對於第二個問題,表格分佈在表格本身的列或列中,或者通過RANDOM(aka循環)分佈方法分佈。就你而言,如果你將數據集存儲在Netezza的表中,那麼你不能在customer_id上分發數據,因爲該列不包含在數據集中。