無監督降維算法將一個矩陣NxC1作爲輸入,其中N是輸入向量的數量,C1是每個向量的分量數量(向量的維數)。結果,它返回一個新的矩陣NxC2(C2 < C1),其中每個矢量的分量數量較少。使用無監督降維的模糊聚類
模糊聚類算法將一個矩陣N * C1作爲輸入,其中N又是輸入向量的數量,C1是每個向量的分量數量。結果,它返回一個新的矩陣NxC2(通常低於C1的C2),其中每個向量的每個分量都表示向量屬於相應聚類的程度。
我注意到兩類算法的輸入和輸出在結構上是相同的,只有結果的解釋發生了變化。而且,在沒有模糊聚類實現scikit學習,所以以下問題:
是否有意義使用降維算法進行模糊聚類? 例如,將FeatureAgglomeration或TruncatedSVD應用於根據從文本數據中提取的TF-IDF矢量構建的數據集並將結果解釋爲模糊聚類是否無效?