我對如何驗證通過data mining algorithms
生成的我們的data mining models
的有用性有些困惑。對於classification
,我確定我們可以將Partition
數據轉換爲測試和訓練集。我們如何確定從clustering and association
生產的模型的有效性?驗證數據挖掘模型的成功
0
A
回答
0
關聯規則可以用於預測,因此可以通過分割數據以相同的方式進行評估。
聚類:你會怎樣使用反正呢?
「證明」羣集的方式是使用結果來改善分類性能,或者通過向人類用戶提供洞察。如果用戶從集羣中獲得了洞察力,那麼它就起作用了!
0
對於聚類(和關聯規則),您可以使用交叉驗證來驗證準確性。例如,Weka提供了檢查聚類準確性的工具,以便您可以調整參數(例如,聚類數量等)。檢查此相關question
相關問題
- 1. 數據挖掘模型名稱由DMX
- 2. 什麼是數據挖掘模型?
- 3. 錯誤(數據挖掘):在挖掘模型中未指定任何案例
- 4. HTML數據挖掘
- 5. python數據挖掘
- 6. Kissmetrics數據挖掘
- 7. hadoop的數據挖掘庫
- 8. 的Oracle SQL導航數據挖掘文本挖掘
- 9. 數據挖掘 - K近鄰
- 10. 休眠4數據挖掘
- 11. JSON到R數據挖掘
- 12. 數據挖掘字符串
- 13. 數據挖掘情況
- 14. R數據挖掘語法
- 15. 「相似性」數據挖掘
- 16. Google數據挖掘工具
- 17. 從數據挖掘開始
- 18. 數據挖掘教科書
- 19. 文本挖掘中的功能數
- 20. 通過SQL Analysis Services挖掘模型檢查/挖掘的前端應用程序
- 21. 數據挖掘海量數據
- 22. 數據挖掘和頻繁數據集
- 23. Web刮,數據挖掘,數據提取
- 24. 數據挖掘項目數據集
- 25. Twitter的數據挖掘:分離
- 26. 與Django的數據挖掘問題
- 27. 挖掘衆包數據的合法性
- 28. 存儲文本數據挖掘的
- 29. 用於MPI的數據挖掘庫
- 30. C#的數據挖掘資源
您也可以定義用於聚類和關聯的測試集。 – axiom 2015-03-30 18:30:48