我正在使用KNN對手寫數字進行分類。我現在也實施了PCA來降低維度。從256我去了200.但我只注意到,〜0.10%的信息損失。我刪除了56維。不應該損失更大?只有當我下降到5個維度時,我會有20%的損失。這是正常的嗎?PCA和KNN算法
13
A
回答
6
您是說在刪除56個維度後,您幾乎沒有信息?當然,這是PCA的重點!正如其名稱所述,可幫助您確定哪些維度包含這些信息。你可以刪除其餘的,這是最重要的部分。
我想要一些例子,在基因分析中,我已經閱讀過使用PCA將維數從40,000減少到100的論文,然後他們做了一些神奇的東西,並且擁有19個維度的優秀分類器。這隱含地告訴你,當他們移除39'900尺寸時,他們幾乎沒有任何信息!
+2
好的謝謝。我有點新機器學習 – 2012-04-20 00:11:34
0
這很正常,是的(就像Fezvez說的那樣)。你的情況實際上是一個很好的例子,你可以看到這是可能的。看看你的數據(這在機器學習中總是很重要,知道你的數據)。如果您有白色黑色手寫數字的圖像,則所有樣本的某些角落中的像素很有可能是白色的(當我在機器上學習手寫數字時,在一個角落有這種情況)。所以實際上在那個像素中沒有任何信息。如果您將它作爲KNN或ANN或其他任何內容的輸入,您將獲得相同的結果。
相關問題
- 1. 鄰居數KNN算法
- 2. 在MATLAB中理解knn算法(分類)
- 3. 用J48和IBk(KNN)算法進行分類
- 4. 使用PCA算法調整數據
- 5. 主成分分析(PCA)算法
- 6. FNN包:R和knn()
- 7. OpenCV PCA在Python中計算
- 8. Excel大數據計算(PCA ...)
- 9. 使用帶KNN算法的監督詞加權方法
- 10. 計算KNN的歐氏距離
- 11. 用於搜索數據庫的KNN算法
- 12. KNN分類器算法不適用於所有情況
- 13. 在kNN算法中改變k的值 - Java
- 14. 如何在j48算法內注入IBk(knn)? (weka,java)
- 15. 複雜特徵值在PCA計算
- 16. C++ - 用於計算PCA(比犰狳等)
- 17. tensorfboard嵌入與「計算PCA」掛起
- 18. 如何計算PCA中的行列式?
- 19. 運行後會發生什麼算法PCA(主成分分析)
- 20. PCA和K-means for word clustering
- 21. Orange PCA和scikit-learn PCA之間的不同結果
- 22. kNN:培訓,測試和驗證
- 23. knn使用餘弦和jaccard的距離
- 24. Weka中的KNN算法永遠不要在大數據集上完成
- 25. 如何在knn算法中創建協方差矩陣Mahalanobis距離
- 26. 我該如何運行knn算法並行使用r進行多分類
- 27. KNN多維向量
- 28. 爲什麼KNN中的KNN實現運行速度更快?
- 29. 如何使用leaflet-knn來計算給定點的最近點?
- 30. Plotting PCA:標記數據點的方法
這種事情在許多類型的應用程序中很常見。這就是所謂的收益遞減點。 – 2012-04-16 23:28:11