0
在HiveQL中,如何根據group1
和group2
計算具有相同分組的id
的數量?如何根據兩個分組變量統計具有相同聚類的觀察值的數量?
+-----+--------+--------+
| id1 | group1 | group2 |
+-----+--------+--------+
| 1 | Z | a |
| 2 | Z | a |
| 3 | Z | b |
| 4 | Z | c |
| 5 | Y | d |
+-----+--------+--------+
結果返回應爲3,因爲我們應該採取的最大值{(Z,A)(Z,B)(Z,C)},它是2,和的最大值{(Y, d)},這是1.
我試圖在沒有成功的情況下使用子查詢在HiveQL中進行編碼。任何提示將不勝感激。
你是怎麼拿到3查詢?你總結了ID嗎? –
是的,這就是目標。仍想着如何編寫這個代碼 – user2205916
爲什麼3 | Z | b | | 4 | Z | c不是你的結果的一部分? –