2017-02-06 44 views
0

我需要從表2中獲取與Hive中表1不同的值。因爲表2有重複的記錄。如何在配置單元中加入不同的值

考慮下面的連接條件是否可以只從表2中取出不同的key_col?我不想使用選擇不同的* ...

SELECT * FROM TABLE_1左連接TABLE_2 B關於a.key_col = b.key_col

注:這是在蜂巢

回答

0

使用左半加入。這將爲您提供table1中存在的所有記錄(重複記錄),而不重複。

選擇*從TABLE_1左半上a.key_col加入TABLE_2 B = b.key_col

+0

值得從文檔注意到:使用LEFT SEMI的限制JOIN是右手側表應僅在連接條件(ON子句)中引用,但不在WHERE或SELECT子句中引用。https://cwiki.apache.org/confluence/display/Hive/LanguageManual+Joins –

相關問題