0

我從Understanding concept of Gaussian Mixture Models讀了GMM的概念。這對我有幫助。我也爲fisheriris實施了GMM,但是我沒有使用fitgmdist函數,因爲我沒有。所以我使用了http://chrisjmccormick.wordpress.com/2014/08/04/gaussian-mixture-models-tutorial-and-matlab-code/的代碼。如何通過GMM迭代爲集羣提供標籤?

當我閱讀Understanding concept of Gaussian Mixture Models時,Amro可以將結果與其標籤即setosa,virginica和versicolor作圖。他是怎麼做到的呢?經過一些迭代後,我只獲得了畝,西格瑪和體重。根本沒有標籤。我想將標籤(setosa,virginica和versicolor)從GMM迭代轉換爲混合模型。

+0

請添加您到目前爲止嘗試過的代碼,以便我們可以幫助您改進它!歡迎來到SO! – darthbith 2014-10-16 13:04:07

+0

您可能想要查看鏈接代碼中的'gscatter(data(:,1),data(:2),species,clrDark)'行。你想看看'物種'的論點。 – 2014-10-16 15:20:50

回答

0

有兩套在情節「標籤」的:

  • 一個是費舍爾虹膜數據集的「真實」標籤(species變量,它包含類的每個實例:setoasversicolor ,或virginica)。通常情況下,你不會在真正的數據集中擁有這些數據集(畢竟聚類的目標是發現數據中的那些你事先不知道的組)。我只是在這裏用它們來了解EM集羣如何與實際情況進行比較(散點是根據類別進行顏色編碼的)。

  • 另一組標籤是我們使用GMM發現的聚類。基本上,我構建了一個50x50的2D點網格來覆蓋整個數據域,然後我通過計算後驗概率並選擇具有最高可能性的分量來爲每個點分配一個聚類。我用背景色顯示了這些簇。作爲一個很好的結果,我們可以看到集羣之間的判別式決策邊界。

你可以看到,左邊的點的集合走散了相當不錯(和完美匹配的setosa類)。雖然情節右側的點與另外兩個類相匹配,但如果您願意(邊界錯誤一側的某些綠色點)存在實例「錯誤分類」,則會發生這種情況。

通常在一個真正的設置,你不會有那些實際的類進行比較的,所以沒辦法告訴如何「準確」的聚類(存在其他指標clustering performance evaluation)...