第k中心點劃分在克拉拉()函數使用距離形成簇,所以我得到這種模式:如何用趨勢而不是按R中的距離進行聚類?
a <- matrix(c(0,1,3,2,0,.32,1,.5,0,.35,1.2,.4,.5,.3,.2,.1,.5,.2,0,-.1), byrow=T, nrow=5)
cl <- clara(a,2)
matplot(t(a),type="b", pch=20, col=cl$clustering)
但我想找到分配一個羣集於每行一個聚類方法根據它的趨勢,第1,2和3行屬於一個集羣,第4行和第5行屬於另一集羣。
這與@joran提出的有何不同?我可能沒有看到差異 – nachocab
剛讀完他的回答:不,這並沒有太大的不同。我建議採用不同的縮放比例。 但是,我想指出的重點是,這屬於預處理的重要步驟,您不能忽視。這就是爲什麼總是談論KDD過程的原因:https://en.wikipedia.org/wiki/Data_mining#Process 這是實際開採中90%的努力,最多隻有5%的科學結果,專注於新算法。 –