0
我需要從表2中獲取與Hive中表1不同的值。因爲表2有重複的記錄。如何在配置單元中加入不同的值
考慮下面的連接條件是否可以只從表2中取出不同的key_col?我不想使用選擇不同的* ...
SELECT * FROM TABLE_1左連接TABLE_2 B關於a.key_col = b.key_col
注:這是在蜂巢
我需要從表2中獲取與Hive中表1不同的值。因爲表2有重複的記錄。如何在配置單元中加入不同的值
考慮下面的連接條件是否可以只從表2中取出不同的key_col?我不想使用選擇不同的* ...
SELECT * FROM TABLE_1左連接TABLE_2 B關於a.key_col = b.key_col
注:這是在蜂巢
使用左半加入。這將爲您提供table1中存在的所有記錄(重複記錄),而不重複。
選擇*從TABLE_1左半上a.key_col加入TABLE_2 B = b.key_col
值得從文檔注意到:使用LEFT SEMI的限制JOIN是右手側表應僅在連接條件(ON子句)中引用,但不在WHERE或SELECT子句中引用。https://cwiki.apache.org/confluence/display/Hive/LanguageManual+Joins –