我對社交網絡遊戲玩家中的模式挖掘問題感興趣。例如,根據公司的用戶數據庫檢測遊戲的作弊者。到目前爲止,我已經按照通常的配方用於數據挖掘項目:與社交網絡上的數據挖掘和遊戲相關的資源
- 構建一個數據倉庫聚集顯著信息
- 選擇一個分類,並從倉庫的記錄subsectio訓練它
- 驗證分類與另一測試設置
- 泡沫,漂洗,重複
出人意料的是,我發現在這方面的有關文獻,最佳實踐等我霍皮人很少在這裏聚集信息收集問題。具體是什麼我在尋找:
- 什麼分類工作過將這種類型的模式挖掘的(似乎非常時間,用戶在玩遊戲,用戶接收獎勵,用戶轉移獎品等)。
- 是否有任何特定於社交網絡/遊戲數據的高度一致的屬性?
- 什麼是應該考慮的實際數量的信息?我遇到的一個問題是數據超載,查詢和數據清理可能需要數天才能完成。
- 與上述要點相關,生成結果需要哪些硬件資源?我發現很難估計我需要用於生產的計算能力的數量。很明顯,角落裏的白色方塊沒有足夠的馬力用於這樣的項目。企業通常採用雲解決方案嗎?他們在購買集羣嗎?
基本上,任何有關實施社交網絡/遊戲模式挖掘程序的資源(理論,學術或實踐)都將非常感激。
謝謝。