2015-07-10 72 views
0

對於各種組合(符合標準的用戶),我們有一個要求,即我們必須在每月的每個小時的每個小時保持不同的計數。我們正在考慮使用HyperLogLog,其他要求之一是提供匹配條件(標準)的並集和交集計數。交叉點數據結構

我們必須在一天/一週/一個月內完成這些操作。據我讀過的工會通過hyperloglog支持。對於交叉點,超過2個hyperloglog的錯誤率似乎很高。有沒有其他的數據結構可以用於交叉口,只能滿足低基數要求的低空間要求或者支持交叉點和聯合計算大量不同事件的交叉點和聯合?

任何指針都會有幫助。謝謝!!

回答

0

檢出擴充HyperLogLog與MinHash

+0

謝謝@Jerry,看起來很有希望將有一個更詳細的看看這個。 – anishek