測試無監督機器學習算法

在互聯網上，我可以看到有監督和無監督機器學習算法的應用，但沒有人談論維護機器學習應用的質量。如何測試提出了這些問題無監督的機器學習算法的最近的分析：

測試無監督機器學習算法

1）交叉驗證測試：數據集被分成相等倍（份），除了一個所有的摺疊被用作訓練集後來被用作測試數據集

使用測試和訓練數據集的選項很少。
是否有更有效的方法來測試輸出不確定的無監督ML算法？

評估無監督機器學習算法的質量是有問題的，因爲不存在外部標準（=無監督）。如果您沒有針對特定的應用程序（集羣，降維......），這個問題太廣泛而無法回答。此外，交叉驗證是監督機器學習算法的最常用評估。 –

我建議在https://stats.stackexchange.com/上提問這個問題。 –

根據您使用的算法類型（以及選擇的距離），您仍然可以嘗試查看組內方差與組內方差是否發生了很大變化。

如果你的算法仍然和你構建它一樣好，那麼它們之間的差異和差異不會有太大的變化。如果收縮（或相反）之間的差異，這意味着您的算法不像以前那樣將組分離得很好。

您可以嘗試的第二件事是保留一些觀察結果（您知道這些觀察結果已被很好地歸類），以便在您重新訓練算法後查看它們是否仍在同一組中。如果不是這樣，這並不意味着你的算法是錯誤的，但是你可以在這種情況下發送一個警報來看看更深。

2018-01-24 10:39:40 thibaultbl

回答