有人可以告訴我,如果有一個很好的(簡單)的方式來形象化高維數據?我的數據目前是21個維度,但我想看看它是密集還是稀疏。有沒有技術來實現這一點?有沒有一種簡單易用的方法來顯示高維數據?
回答
Principal component analysis可能會有幫助,如果尺寸相關。
Parallel coordinates是可視化高維數據的流行方法。
什麼樣的可視化最適合您的數據,具體取決於它的特點 - 不同的維度有多相關?
星型模式。
http://en.wikipedia.org/wiki/Star_schema
可以很好地用於高維數據。
如果您的事實表的基數接近您的維度大小的乘積,那麼您的數據密集。
如果事實數據表的基數小於維度大小的乘積,則表示數據稀疏。
中間有一個判斷電話。
我會搜索的流行詞是multidimensional scaling。這是一種從高維空間向下空間(2維或3維)投影的技術,其方式是在整個空間中靠近的點將在投影中靠近。
它通常用於可視化聚類算法的輸出(即,如果您的羣集在MDS投影中很緊湊,那麼它們很可能也處於整個空間中)。
編輯:這不一定有助於確定數據是密集還是稀疏的,因爲您在投影中丟失了比例尺,但它會顯示它是統一的還是塊狀的(也許這就是您的意思)。
curios.IT數據瀏覽軟件專爲高維數據的可視化而設計:數據顯示爲3D對象(每個數據組一個)的集合,可同時顯示多達13個變量。數據變量和視覺特徵之間的關係比其他技術(如平行座標)更易於記憶。
不知道你想從數據中看到什麼樣的模式。 t-SNE及其更快速的變體Barnes-Hut-SNE在高維數據的相關概念組可視化方面做得非常好。它可以通過R.
有一個簡短的教程使用它對300維的高維數據。 http://www.codeproject.com/Tips/788739/Visualizing-High-Dimensional-Vector-using-T-SNE-wi
查看http://www.ggobi.org(遊覽,平行座標,散點圖矩陣)可用於實值變量。最近還有http://cranvas.org。 R中的遊覽包。
我一直在尋找可視化高維數據的方法,並發現這個已被有效使用的t-SNE technique。也可以幫助別人。
嘗試使用http://hypertools.readthedocs.io/en/latest/。
HyperTools是一個用於在Python中可視化和操作高維數據的庫。
- 1. 有沒有一種簡單的方法來顯示matlab GUI中的「表」?
- 2. 有沒有一種簡單的方法來通過`imgCounter.src =`
- 3. 有沒有一種簡單的方法來創建代碼TextBox?
- 4. 有沒有一種簡單的方法來document.createElement多個元素?
- 5. 有沒有一種方法來表示hibernate的數據視圖?
- 6. 有沒有一種簡單的方法來分發Access數據庫引擎
- 7. 有沒有一種簡單的方法在Visual Studio中針數據提示2010
- 8. 有沒有一種簡單的方法來使用SpriteKit計算小數?
- 9. 有沒有一種方法來簡化函數簽名playframework
- 10. 有沒有一種簡單的方法來用Dotty編譯一個sbt項目?
- 11. 有沒有一種簡單的方法來重構C#中的參數?
- 12. 有沒有更簡單的方法來設置UIView的高度?
- 13. 有沒有一種簡單的方法使用django禿鷲?
- 14. 有沒有一種簡單的方法來分配結構數組
- 15. 有沒有一種簡單的方法來顯示帶有Glide的圖像的圖像?
- 16. 有沒有一種簡單的方法來處理PHP的表單?
- 17. 有沒有一種方法來讀取使用數據流
- 18. 有沒有一種簡單快捷的方式來生成JavaScript?
- 19. 有沒有一種簡單的方法來實現LINQ來與DataContext對象?
- 20. 與android的editText控件有沒有簡單的方法來顯示數字?
- 21. 有沒有一種簡單的方法來重複一個PHP的MySQL查詢?
- 22. 有沒有一種簡單的方法來用ArrayList填充微調器?
- 23. 有沒有一種簡單的方法來用Apache webserver運行Java servlet?
- 24. 有沒有一種簡單的方法來用Javascript創建動態變量?
- 25. 有沒有一種簡單的方法來垂直居中div並讓它們以內聯方式顯示?
- 26. 有沒有一種方法可以提高我簡單的textfilter的性能?
- 27. 有沒有簡單的方法來找到一個數字
- 28. 簡單的JFrame沒有顯示出來
- 29. 有沒有一種更簡單的方法來迭代Matlab中的二維數組?
- 30. 有沒有一種方法來獲得整個'ScrollView'的高度?
我不知道答案,但是,我可以告訴你,優化這是一個非常熱門的研究課題。 – 2011-04-25 13:55:09
我建議使用Tableau或Spotfire等可視化工具。即使如此,21個維度是很多,所以你可能需要執行某種降維技術,以達到一個有意義的水平http://www.tableausoftware.com/public – 2011-04-25 14:54:57