3
A
回答
4
COUNT DISTINCT估計的準確性取決於實際值的實際數量。如果它很小 - 算法非常精確(對於小值,它通常會返回確切值),但是更大數量的不同值 - 它可能變得不太準確。請注意,該COUNT(DISTINCT)採用第二個參數,它交易內存的準確性,即它將使用更多的內存,但更準確。例如:
SELECT COUNT(DISTINCT x, 100000) FROM T
如果整數值小於100,000,將返回相當準確的結果。
COUNT不同估計的精確算法會有所不同,但不同的變化會有類似的誤差估計 - 約1/SQRT(N),其中N是第二個參數。默認值是1000,相當於大約3%的錯誤。如果碰到10000,則會有大約1%的錯誤。
+0
估計錯誤實際上就是我所要求的 - 我們想要了解錯誤會有多大,比如<= 1%? – Fardream
+0
我更新了答案以給出估計 –
相關問題
- 1. BigQuery COUNT(DISTINCT值)與COUNT(值)
- 2. SQL語法錯誤(COUNT(DISTINCT ..))
- 3. DISTINCT COUNT返回SQL錯誤
- 4. BigQuery count distinct ColX不等於ColX組的計數
- 5. 當使用COUNT(DISTINCT ...)時BigQuery錯誤「響應太大而無法返回」
- 6. 多列上出現SELECT COUNT(DISTINCT ...)錯誤?
- 7. distinct count(*)
- 8. pyodbc parameterised sql result count distinct distinct
- 9. mysql count distinct value
- 10. SQL DISTINCT plus count
- 11. SQL count distinct
- 12. sql distinct + count
- 13. COUNT DISTINCT MS ACCESS
- 14. JPA Select Count Distinct
- 15. SELECT COUNT(DISTINCT [名])
- 16. tsql distinct count subquery2
- 17. Count DISTINCT Employees
- 18. MySQL COUNT DISTINCT
- 19. SQL count(*)and distinct
- 20. Laravel Distinct Count
- 21. SELECT COUNT(DISTINCT ..)
- 22. Count()return total instead distinct count
- 23. 如何計算SUM(DISTINCT field1) - COUNT(field2)?
- 24. 導軌COUNT SELECT DISTINCT
- 25. MYSQL LIMIT COUNT DISTINCT行
- 26. SELECT COUNT(DISTINCT v))performance
- 27. MySQL order by COUNT DISTINCT
- 28. SQLite的COUNT JOIN DISTINCT
- 29. MySQL查詢DISTINCT,COUNT
- 30. Select Count Distinct Syntax,vb.net
也許你可以比較它以計數(唯一())多次。如果數據太大以致count(unique())甚至不能工作,那麼這種方法可能不起作用。我認爲更多的是經驗理論。 – andrewm4894
您也可以使用EXACT_COUNT_DISTINCT。 https://cloud.google.com/bigquery/query-reference#exact_count_distinct – YABADABADOU