2017-02-13 41 views
0

我是數據庫新手,我對k-means(或任何)聚類算法有更多的理論問題。在這一刻,我正試圖根據行爲數據進行客戶細分。我們設計的一些屬性,如: - 即一個客戶購買銷售的產品, 百分比 - 的產品,平均每一次 - 每個產品 平均價格 - 和其他幾個人 - 購買產品的商店 的頻率。按客戶羣分組

我們正在努力完成的是一羣彼此行爲相似的客戶,因此我們可以根據他們的偏好與他們溝通。問題在於,我不確定聚類的結果是否能給我們提供合適的分段。可能會確定其他類似的行爲,但不適合實際使用。

我的問題如下;使用分類器算法會更好嗎,這樣我可以確定目標變量,還是應該使用聚類算法?如果我必須選擇一種聚類算法,那麼減少屬性數量會更好嗎,所以我對結果的使用方式有了更多的控制權?

我希望你們能幫我解決這個概念問題。

回答

0

如果你可以使用分類,那麼總是使用分類。

聚類是脆弱的,不是一個非常明確的問題。您不想將業務構建到集羣算法上。