我在R^3中有n個要用k個橢圓體或圓柱體覆蓋的點(我並不在乎,哪個更容易)。我想盡量減少卷的聯合。假設n是數萬,k是少數。開發時間(即簡單性)比運行時更重要。帶有橢圓體的k-means
很明顯,我可以運行k-means並使用完美的球體作爲我的橢球體。或者我可以運行k-means,然後使用每個簇的最小封閉橢球而不是用球覆蓋,儘管在最壞的情況下這並不好。我已經看過用k-means來處理各向異性的討論,但我看到的鏈接似乎認爲我手中有張量;我不知道,我只知道這些數據將是橢球體的聯合體。有什麼建議麼?
[編輯:有幾個選票適合多元高斯混合,這似乎是一個可行的事情嘗試。啓動一個EM代碼來做到這一點不會使工會的體積最小化,但當然k-means並不會使體積最小化。]
NP-hard不會嚇到我;我只需要一個近似值,而我的數據不是由小工具組成的。或者如果是這樣,我可以指責用戶。 EM計算高斯混合並不真正減少我想盡量減少。它可能工作得很好,所以我會嘗試一下--k-means不會使它最小化。 – bhudson