我試圖做一個公司的訪問權限一些數據挖掘。我試圖根據他們擁有的訪問權將不同的組聚合在一起,然後確定是否有人的訪問受到懷疑,因爲他們的組對等人都沒有訪問權限。我只是在尋找一種算法來幫助我。這幾乎是一個逆推薦系統(即Netflix,亞馬遜)。這裏有一個簡單的例子:檢測異常
Person 1 has access to files A, B, E
Person 2 has access to files A, B
Person 3 has access to files A, B
Person 4 has access to files C, D, E
Person 5 has access to files C, D
Person 6 has access to files C, D, E
我希望能夠沒有它(無監督學習)是1-3人及人事4-6是同樣的功能,並有可能在同一組,因爲分類認識到自己的類似的文件訪問(集羣)。之後,我們確定了集羣,那麼WE標誌異常訪問,這是人1文件E.
我試圖尋找到AI4R Ruby庫,而是來到了一個死衚衕。有很多算法可供選擇。我只需要指出正確的方式。謝謝。
怎麼樣一個簡單的GROUP_BY?可能會給你一個概述。 – three 2012-02-17 21:53:00