-2
我是新開發的過濾器概念。請讓我知道你的想法。我有3種類別。每種類型都包含數十億類別。數十億類別的Bloom過濾器實現
我需要3個布隆過濾器對象還是有任何方法來管理對象中的所有類別類型?
我使用Apache hadoop bloom過濾器實現,即
org.apache.hadoop.util.bloom.Filter
。還有其他的實現比這更好嗎?什麼應該是處理億次記錄的理想位數組大小?
我是新開發的過濾器概念。請讓我知道你的想法。我有3種類別。每種類型都包含數十億類別。數十億類別的Bloom過濾器實現
我需要3個布隆過濾器對象還是有任何方法來管理對象中的所有類別類型?
我使用Apache hadoop bloom過濾器實現,即org.apache.hadoop.util.bloom.Filter
。還有其他的實現比這更好嗎?
什麼應該是處理億次記錄的理想位數組大小?
我需要3個布隆過濾器對象:這取決於你想要做的(你沒有描述),是什麼。
有沒有其他的實現:當然!嘗試使用Google。
理想的位數組大小:它取決於你想要做什麼。嘗試閱讀Wikipedia article about Bloom filters。有計算概率的公式。
目前還不清楚你將在你的類別集上執行什麼樣的操作。你只是插入和檢查會員資格?你會容忍誤報嗎(當過濾器告訴你「是」的元素,實際上是缺席)。如果是和是,那麼Bloom過濾器可能是一個不錯的選擇。至於數十億的數量級問題,我非常懷疑布盧姆過濾器會比簡單的比特更好 – HEKTO