我該如何檢查一個分叉的桌子的分區是否正確裝有袋子?只檢查分區中文件的數量等於表的桶數似乎不夠。如何檢查每個存儲桶中的所有行是否只屬於該存儲桶。謝謝。蜂巢:帶肩表的健康檢查
1
A
回答
0
我希望下面將有助於
DESCRIBE EXTENDED page_view PARTITION (ds='2008-08-08');
我從這裏
0
得到了它,我不知道它會工作,但我想,如果表由列cluseretd, b分成n個桶,然後hash(a,b)%n
是桶號(你可以在hdfs的文件名中看到它)。
如果您不確定,可以隨時插入oevrwrite選擇自己的分區並將hive.force.bucketing
設置爲true。
0
如果存儲桶是在colA上分區的,那麼您可以驗證每個存儲桶的計數。 假設我們在colA中存儲了多年,所以每個存儲桶只有一年的行數。我們可以通過運行來驗證這一點,並查看是否所有的桶只有一年的行。
SELECT distinct Year FROM bucketed_table tablesample(bucket 1 out of Y on year);
SELECT distinct Year FROM bucketed_table tablesample(bucket 2 out of Y on year);
此外,我們可以通過使用where子句運行查詢來驗證計數。 SELECT count(*) FROM bucketed_table tablesample(bucket 1 out of Y on year);
//suppose that bucket 1 stores year X
SELECT count(*) FROM bucketed_table where year=X;
這又是不是檢查您的hvie桶的正確性肯定拍的方式,但肯定的,如果你知道數據良好,您可以使用此策略來驗證你的表。
相關問題
- 1. gitlab健康檢查不健康
- 2. SSRS健康檢查
- 3. MySQL健康檢查
- 4. UDP健康檢查
- 5. elb健康檢查和ec2健康檢查有什麼區別?
- 6. Elixir的Postgres健康檢查
- 7. WSO2流健康檢查
- 8. Haproxy健康檢查端口
- 9. Js noob健康檢查
- 10. 健康檢查MassTransit和Rabbitmq
- 11. C3P0連接健康檢查
- 12. HAproxy被動健康檢查
- 13. DB健康檢查Rails中
- 14. 蜂巢表是空的檢查
- 15. HAProxy的Solr的健康檢查
- 16. Cloud Foundry中的健康檢查
- 17. 健康檢查失敗 - Atlassian的Localstack
- 18. Spring Data Solr的Spring Boot健康檢查
- 19. 查詢蜂巢分區表
- 20. Sqoop查詢到蜂巢表
- 21. 從蜂巢表
- 22. 蜂巢表鎖
- 23. INSERT表蜂巢
- 24. 健康檢查爲使用SQL Server 2008
- 25. 添加健康檢查中Startup.Configure
- 26. 可能有AWS健康檢查頁面?
- 27. solr健康檢查> 0文檔
- 28. java pos健康檢查問題
- 29. 健康檢查無法正常工作
- 30. AWS AutoScaling:如何禁用健康檢查
DESCRIBE EXTENDED只是返回元數據信息。我如何確保數據正確分配? –