所以問題的基本前提是我在hadoop中有一些巨大的表格,我需要從每個月獲取一些樣本。我嘲笑了下方顯示排序後,我的事情,但顯然它不是真實的數據... --Create the table
CREATE TABLE exp_dqss_team.testranking (
Name STRING,
Age INT,
Favourite_Cheese STRING
) ST
我有一個查詢需要很長時間(187.42秒)來查找所有包含屬性(c.scr)的相關文檔,並從該列表中給出文檔使用最新的文件日期進行處理。我想知道是否有人可以提供任何建議來優化查詢。 請注意,我確實玩過ROW_NUMBER,RANK和DENSE_RANK,他們甚至更慢,所以這是迄今爲止我所得到的最好的。 (Query) total time '187.42 seconds':
SE