我知道,一個人需要,以取代IN查詢相結合的半左連接(如Hive doesn't support in, exists. How do I write the following query?),但我不知道如何將它與一個WHERE子句結合:轉化蜂房subselect查詢與WHERE更換
SELECT *
from foo
WHERE userId IN
(SELECT distinct(userId) FROM foo WHERE x=true ORDER BY RAND() LIMIT 100);
謝謝。
編輯:更改了查詢。意圖是創建一個隨機的條目樣本(統計明智)。
不知道你的查詢應該做什麼。你確定它是正確的嗎?查詢的輸入和預期輸出是什麼? –
對不起,也許有點過於僞語法。子查詢應該返回一個隨機樣本的ids(limit + rand())。第一個選擇條款應該返回整個數據。我糾正了查詢更具表現力。 –