您想按照量級對特徵值進行排序,然後選取最高的1或2個值。具有非常小的相對值的特徵值可以被認爲是排除的。然後,您可以翻譯數據值並僅使用前1或2個特徵向量來繪製結果的維度。這將給出PCA拆分的視覺表示。另請參閱scikit-learn瞭解PCA的更多信息。精度,召回,F1分數會告訴你它有多好作品
從http://sebastianraschka.com/Articles/2014_pca_step_by_step.html ...
步驟1:3D舉例
「對於我們的簡單的例子,我們正在減少的3維特徵空間的2維特徵空間中,我們結合兩個特徵向量具有最高特徵值來構建我們的d×KD×k維特徵向量矩陣WW
matrix_w = np.hstack((eig_pairs[0][1].reshape(3,1),
eig_pairs[1][1].reshape(3,1)))
print('Matrix W:\n', matrix_w)
>>>Matrix W:
[[-0.49210223 -0.64670286]
[-0.47927902 -0.35756937]
[-0.72672348 0.67373552]]"
步驟2:實施例3D
「 在最後的步驟中,我們使用2×32×3維矩陣WW,我們只是計算經由方程 y以我們的樣品變換到新的子空間= W^T×X
transformed = matrix_w.T.dot(all_samples)
assert transformed.shape == (2,40), "The matrix is not 2x40 dimensional."