1

我想評估3個類的功能的可分離性,併爲其他2個功能集執行相同的操作,並最終顯示出我的功能提供了最佳的可分離性。爲了更清楚地說明,我想要測量不同類別以及每個類別的緊湊程度。我發現散射矩陣是一個很好的選擇。評估類的可分性

我的問題是:

  1. 他們能來當數據不是線性可分/當數據的分佈是未知或不高斯使用(某處,我讀了散射矩陣是有用的,當數據是線性可分的或高斯分佈的)。

  2. 這隻會給我一些數字,是否存在一種圖形化的方式來說明可分性。我的功能是256-D,並有409個數據實例。

+0

對於圖形說明,嘗試叔SNE,這是反映2D高維結構的流行的現代方式 –

回答

0

爲了評估集羣有多遠,您可以做一個簡單的測試:計算每個集羣的平均點並查看這些點之間的距離。這不會告訴你數據是可分離的,還是數據點在集羣內的分散程度如何,但它會告訴你發生了什麼。

關於散佈矩陣,它是協方差矩陣的近似值: 協方差矩陣(通常你會看它的特徵值/向量)描述了一組數據點。你會問這裏的問題是:好的,最大化數據變化的方向是什麼,從而傳遞大部分能量。它不關心數據是線性可分的還是數據的分佈是什麼。

我不認爲有一個很好的方式來拍攝256維的數據!但你可以繪製利潤率等。

希望這有助於, 亞歷