2017-05-28 204 views
0

這是我有的考試任務。假設我有一個200x6的矩陣,其中200人對6個問題投票選出電影,每個問題持續[0,1]級(0:不同意,1:同意)。 要獲得6維數據集的有用概述,我想繪製數據的2級近似值。首先,我做了2級近似:Matlab繪圖與中間座標散點圖

A = (200, 6); %some data 
[U, S, V] = svd(A); 
Ak = U(:, 1:2) * S(1:2, 1:2) * V(:, 1:2)'; 

我想繪製這種近似爲2D散點圖以「*」 - 使用U或V每個調查參與者標識座標爲根據我的數據是如何中間座標有組織的問題是,我不知道中間座標是什麼意思,我無法在任何地方找到一個好的解釋。不知道是否有人可以提供幫助,最終提供一個小代碼示例。任何幫助表示感謝,謝謝。

回答

0

形式上,中間軸是數據的(正交)線性組合(沿最大解釋方差,也稱爲主分量)。如果大多數數據具有相似的形狀(例如[5 4 3 2 1 0]模式),那麼第一個分量將類似於這個形狀/向量,因爲它產生的方差是最小的(或者:沿它的方差是最大的)。接下來的組件也可以最大限度地減少直角座標系中的其餘方差。因此,答案是:主要組件1和2

而且更爲謹慎:第一個中間座標值可以理解爲單個數據樣本中「第一個主要模式」的大小。