2011-04-25 65 views
16

有人可以告訴我,如果有一個很好的(簡單)的方式來形象化高維數據?我的數據目前是21個維度,但我想看看它是密集還是稀疏。有沒有技術來實現這一點?有沒有一種簡單易用的方法來顯示高維數據?

+2

我不知道答案,但是,我可以告訴你,優化這是一個非常熱門的研究課題。 – 2011-04-25 13:55:09

+0

我建議使用Tableau或Spotfire等可視化工具。即使如此,21個維度是很多,所以你可能需要執行某種降維技術,以達到一個有意義的水平http://www.tableausoftware.com/public – 2011-04-25 14:54:57

回答

16

Parallel coordinates是可視化高維數據的流行方法。

什麼樣的可視化最適合您的數據,具體取決於它的特點 - 不同的維度有多相關?

0

星型模式。

http://en.wikipedia.org/wiki/Star_schema

可以很好地用於高維數據。

如果您的事實表的基數接近您的維度大小的乘積,那麼您的數據密集。

如果事實數據表的基數小於維度大小的乘積,則表示數據稀疏。

中間有一個判斷電話。

8

我會搜索的流行詞是multidimensional scaling。這是一種從高維空間向下空間(2維或3維)投影的技術,其方式是在整個空間中靠近的點將在投影中靠近。

它通常用於可視化聚類算法的輸出(即,如果您的羣集在MDS投影中很緊湊,那麼它們很可能也處於整個空間中)。

編輯:這不一定有助於確定數據是密集還是稀疏的,因爲您在投影中丟失了比例尺,但它會顯示它是統一的還是塊狀的(也許這就是您的意思)。

0

curios.IT數據瀏覽軟件專爲高維數據的可視化而設計:數據顯示爲3D對象(每個數據組一個)的集合,可同時顯示多達13個變量。數據變量和視覺特徵之間的關係比其他技術(如平行座標)更易於記憶。

2

我一直在尋找可視化高維數據的方法,並發現這個已被有效使用的t-SNE technique。也可以幫助別人。

+0

非常垃圾看 – Cory 2017-06-15 16:04:23

+0

什麼是@Cory ?當我嘗試搜索我正在使用的高維數據的良好可視化和我鏈接的t-SNE頁面時,我發現這個問題是一個很好的開源軟件,我認爲這會有利於其他人尋找一個 – 2017-06-15 19:10:49

+0

對不起,第一篇文章,一個鏈接,我瞥了一眼頁面,它看起來很可信,但我看到無數垃圾帖子都是一樣的。對不起,我很困惑,你可以請編輯你的文章,以便它可以讓我改變投票。 – Cory 2017-06-15 19:20:28

相關問題