2017-03-07 92 views
1

在互聯網上,我可以看到有監督和無監督機器學習算法的應用,但沒有人談論維護機器學習應用的質量。 如何測試提出了這些問題無監督的機器學習算法的最近的分析:

測試無監督機器學習算法

1)交叉驗證測試:數據集被分成相等倍(份),除了一個所有的摺疊被用作訓練集後來被用作測試數據集

使用測試和訓練數據集的選項很少。
是否有更有效的方法來測試輸出不確定的無監督ML算法?

+0

評估無監督機器學習算法的質量是有問題的,因爲不存在外部標準(=無監督)。如果您沒有針對特定的應用程序(集羣,降維......),這個問題太廣泛而無法回答。此外,交叉驗證是監督機器學習算法的最常用評估。 –

+0

我建議在https://stats.stackexchange.com/上提問這個問題。 –

回答

0

根據您使用的算法類型(以及選擇的距離),您仍然可以嘗試查看組內方差與組內方差是否發生了很大變化。

如果你的算法仍然和你構建它一樣好,那麼它們之間的差異和差異不會有太大的變化。如果收縮(或相反)之間的差異,這意味着您的算法不像以前那樣將組分離得很好。

您可以嘗試的第二件事是保留一些觀察結果(您知道這些觀察結果已被很好地歸類),以便在您重新訓練算法後查看它們是否仍在同一組中。如果不是這樣,這並不意味着你的算法是錯誤的,但是你可以在這種情況下發送一個警報來看看更深。