6

任何人都可以提供EM算法的簡單數字示例,因爲我不確定給出的公式是什麼?一個非常簡單的具有4或5個笛卡爾座標系的座標將完全可以做到。期望最大化算法的數字示例

+0

**你的意思是這**的EM變種?常見的高斯混合算法?你有什麼理解?馬哈拉諾比斯距離是完全清晰的嗎? – 2013-02-11 13:30:57

+0

對,我需要高斯混合模型。那麼,我認爲我得到了直覺(高層次),但我不能將這些公式應用於一個簡單的例子。 – Michael 2013-02-11 13:56:56

+0

試試這個[教程](http://www.dbs.ifi.lmu.de/Lehre/KDD/SS12/uebung/Tutorial05ClusteringEM.pdf)。它只做了一個步驟(它不會重新計算矩陣!),但我認爲它會回答您的一些問題,並且非常直觀。 – 2013-02-11 16:07:29

回答

5

你看這個: http://en.wikibooks.org/wiki/Data_Mining_Algorithms_In_R/Clustering/Expectation_Maximization_(EM)#A_simple_example

我也寫(編輯)一個簡單的例子,R A年前,不幸的是我無法找到它。我稍後再試一次。

編輯:這是 -

 
EM <- function() 
{ 
    ### Read file, get necessary cols 
    dataFile <- read.csv("wine.csv", head = FALSE, sep = ",") 
    sl <- dataFile[, 2] 
    #sw <- dataFile[, 3] 
    #pl <- dataFile[, 3] 
    #pw <- dataFile[, 4] 
    class <- dataFile[, 5] 
    N <- length(sl) 
    pi1 <- 0.5 
     ### Init ### 
    rand1 <- floor(runif(1) * N) 
    rand2 <- floor(runif(1) * N) 
    mu1 <- sl[rand1] 
    mu2 <- sl[rand2] 
    mean1 <- sum(sl)/N 
    sigma1 <- sum( (sl - mean1) ** 2) /N 
    sigma2 <- sigma1 
    print(mu1) 
    print(mu2) 
    print(sigma1) 
    print(sigma2) 
    COUNTLIM <- 10 
    count <- 1 
    prevmu1 <- 0.0; 
    prevmu2 <- 0.0; 
    prevsigma1 <- 0.0; 
    prevsigma2 <- 0.0; 
    gamma <- array(0, length(sl)) 
    while (count <= COUNTLIM) 
    { 
     gamma <- pi1 * dnorm(sl, mu2, sigma2)/ ((1 - pi1) * dnorm(sl, mu1, sigma1) + pi1 * dnorm(sl, mu2, sigma2)) 
     mu1 <- sum((1 - gamma) * sl)/sum(1 - gamma)
mu2 <- sum((gamma) * sl)/sum(gamma)
sigma1 <- sum((1 - gamma) * (sl - mu1) ** 2)/sum(1 - gamma) sigma2 <- sum((gamma) * (sl - mu2) ** 2)/sum(gamma) pi1 <- sum(gamma)/N print(c(mu1, mu2, sigma1, sigma2, pi1)) if (count == 1) { prevmu1 <- mu1; prevmu2 <- mu2; prevsigma1 <- sigma1; prevsigma2 <- sigma2; } else { val <- ((prevmu1 - mu1)*2 + (prevmu2 - mu2)*2 + (prevsigma1 - sigma1)*2 + (prevsigma2 - sigma2)*2) ** 0.5; print(c("val: " , val)) if (val <= 1) { break; } } count <- count + 1 } print(mu1) print(mu2) print(sigma1) print(sigma2) }

+0

您可以鏈接(或|和描述)wine.csv數據嗎?我起訴,我發現它。它是:http://archive.ics.uci.edu/ml/machine-learning-databases/wine/wine.data? – andi 2013-09-04 14:40:02

+0

是的,對不起,就是那個。 – 2013-09-04 14:47:53