2

我嘗試了主特徵分析(PCA)功能選擇,該功能從9個特徵(綠色的平均值,綠色的差異,綠色的標準特徵,紅色的平均值,紅色的方差,紅色的平均值,色調的平均值,色調的方差,色調的標準值,即[MGcorr,VarGcorr,stdGcorr,MRcorr,VarRcorr,stdRcorr,MHcorr,VarHcorr,stdHcorr] )將數據分類爲兩個羣集。從文獻看來,PCA似乎不是很好的方法,而是應用內核PCA(KPCA)來進行特徵選擇。我想申請KPCA的特徵選擇和我曾嘗試以下操作:使用內核PCA(KPCA)的功能選擇

d=4; % number of features to be selected, or d: reduced dimension 
[Y2 eigVector para ]=kPCA(feature,d); % feature is 300X9 matrix with 300 as number of 
             % observation and 9 features 
             % Y: dimensionanlity-reduced data 

以上kPCA.m功能,可以從以下網址下載: http://www.mathworks.com/matlabcentral/fileexchange/39715-kernel-pca-and-pre-image-reconstruction/content/kPCA_v1.0/code/kPCA.m

在上面實現,我想知道如何找到其中4個特點從9個特徵選擇(即哪些頂級特徵是最優的)用於聚類。

可替換地,我也嘗試下面的函數爲KPCA實現:

options.KernelType = 'Gaussian'; 
options.t = 1; 
options.ReducedDim = 4; 
[eigvector, eigvalue] = KPCA(feature', options); 

在上述實施方式還我在從組9個特徵確定所述4頂部/最佳特徵同樣的問題。 http://www.cad.zju.edu.cn/home/dengcai/Data/code/KPCA.m

這將是巨大的,如果有人可以幫助我在執行核PCA我的問題:

以上KPCA.m功能可以從以下網址下載。

謝謝

回答

4

PCA本身不提供最佳功能。它提供的是一組不相關的新功能。當你選擇「最佳」4個特徵時,你選擇了具有最大變異(最大特徵值)的特徵。因此,對於「正常」PCA,只需選擇與4個最大特徵值對應的4個特徵向量,然後通過矩陣乘法將原始9個特徵投影到這些特徵向量上。

從您爲內核PCA函數提供的鏈接看,返回值Y2看起來是原始數據,轉換爲內核PCA空間的頂部d功能,因此已經爲您完成了轉換。