2015-03-30 25 views
0

我對如何驗證通過data mining algorithms生成的我們的data mining models的有用性有些困惑。對於classification,我確定我們可以將Partition數據轉換爲測試和訓練集。我們如何確定從clustering and association生產的模型的有效性?驗證數據挖掘模型的成功

+0

您也可以定義用於聚類和關聯的測試集。 – axiom 2015-03-30 18:30:48

回答

0

關聯規則可以用於預測,因此可以通過分割數據以相同的方式進行評估。

聚類:你會怎樣使用反正呢?

「證明」羣集的方式是使用結果來改善分類性能,或者通過向人類用戶提供洞察。如果用戶從集羣中獲得了洞察力,那麼它就起作用了!

0

對於聚類(和關聯規則),您可以使用交叉驗證來驗證準確性。例如,Weka提供了檢查聚類準確性的工具,以便您可以調整參數(例如,聚類數量等)。檢查此相關question