2014-01-30 36 views
-2

我是新開發的過濾器概念。請讓我知道你的想法。我有3種類別。每種類型都包含數十億類別。數十億類別的Bloom過濾器實現

  1. 我需要3個布隆過濾器對象還是有任何方法來管理對象中的所有類別類型?

  2. 我使用Apache hadoop bloom過濾器實現,即org.apache.hadoop.util.bloom.Filter。還有其他的實現比這更好嗎?

  3. 什麼應該是處理億次記錄的理想位數組大小?

+0

目前還不清楚你將在你的類別集上執行什麼樣的操作。你只是插入和檢查會員資格?你會容忍誤報嗎(當過濾器告訴你「是」的元素,實際上是缺席)。如果是和是,那麼Bloom過濾器可能是一個不錯的選擇。至於數十億的數量級問題,我非常懷疑布盧姆過濾器會比簡單的比特更好 – HEKTO

回答

2
  1. 我需要3個布隆過濾器對象:這取決於你想要做的(你沒有描述),是什麼。

  2. 有沒有其他的實現:當然!嘗試使用Google

  3. 理想的位數組大小:它取決於你想要做什麼。嘗試閱讀Wikipedia article about Bloom filters。有計算概率的公式。