5
A
回答
1
我不是專家,但我認爲維度只是表示已賦予單詞的變量(又名屬性或特徵),儘管可能比這更多。每個維度的含義和維度的總數將特定於您的模型。
我最近看到從張量流動圖書館這一可視化嵌入: https://www.tensorflow.org/get_started/embedding_viz
這尤其有助於降低高維模型到什麼人可感知。如果你有三個以上的變量,則很難想象羣集(除非你是斯蒂芬霍金顯然)。
這wikipedia article on dimensional reduction和相關頁面討論如何功能的維度,以及有太多的問題。
2
像word2vec或GloVe這樣的詞嵌入不會在二維矩陣中嵌入單詞,它們使用一維矢量。 「維度」是指這些向量的大小。它與詞彙量的大小是分開的,這是您實際保留向量的詞語數量,而不是僅僅投出。
理論上,較大的向量可以存儲更多的信息,因爲它們有更多的可能狀態。在實踐中,除300-500之外沒有太多好處,並且在一些應用中甚至更小的載體工作正常。
下面是GloVe homepage的圖形。
向量的維數被示出在左側軸;例如,減小它會使圖形變短。每列是一個單獨的矢量,每個像素的顏色由矢量中該位置的數字確定。
相關問題
- 1. 視覺詞包:什麼是合理的單詞(矢量)維度?
- 2. 爲什麼CNTK使用解碼器的嵌入維度?
- 3. 什麼是Blaze中的「合成維度」?
- 4. 什麼是嵌入式JavaScript?
- 5. 「嵌入」是什麼意思?
- 6. 什麼是嵌入式零?
- 7. 爲什麼詞嵌入實際上是矢量?
- 8. 什麼是因果維度在DWH
- 9. 維度降低是什麼意思?
- 10. 嵌入式資產的類是什麼?
- 11. 爲什麼TF-IDF詞彙單詞表示爲座標軸/維度?
- 12. Keras:嵌入層+ LSTM:時間維度
- 13. 什麼是動詞=「*」?
- 14. 什麼是低維?
- 15. 在土耳其文中嵌入英文單詞的預期結果是什麼?
- 16. 什麼行爲是首選? (嵌入Python)
- 17. 什麼是嵌入式LDAP服務器
- 18. 什麼是meta-open嵌入式,meta-linaro?
- 19. 什麼是嵌入式服務器和嵌入式Java庫?
- 20. Keras嵌入圖層蒙版。爲什麼input_dim需要|詞彙| + 2?
- 21. 什麼是謂詞檢查?
- 22. 什麼是詞彙「這個」?
- 23. 什麼是纖維餅乾?
- 24. 什麼是多維字典?
- 25. 什麼是語義維基?
- 26. 是什麼字向量維
- 27. 單詞之間相似度最好的WordNet函數是什麼?
- 28. 連接層後googlenet中的輸出維度是什麼?
- 29. Windows CMD /命令提示符的維度是什麼?
- 30. 什麼是提取維度/事實數據的建議順序?
請看這裏:https://stackoverflow.com/questions/38137551/what-is-word-vector-dimension – polm23