回到datamining並與Weka和WekaSharp一起使用datamining的問題。通過WekaSharp,我對一個相當大的數據集進行了一些分析,這個數據集是KDD Cup 1999 10%數據庫(〜70 mb)。使用決策樹J48算法和樸素貝葉斯算法每個都需要10到30分鐘才能完成,我獲得了很好的結果。當我通過KNN算法運行相同的數據,並且它從未完成分析時,它不會錯誤地直接運行。我嘗試了所有不同的參數,但沒有任何效果。當我在一個較小的樣本數據集(如iris.arff)上運行相同的KNN算法時,它完成並不困難。這裏是我對KNN參數的設置: 「-K 1 -W 0 -A \」weka.core.neighboursearch.KDTree -A \\「weka.core.EuclideanDistance -R first-last \\」「\」 「 KNN和大型數據集是否存在固有的問題,還是存在安裝問題?非常感謝你。Weka中的KNN算法永遠不要在大數據集上完成
2
A
回答
2
kNN受到「維度災難」的影響:高維數據集的空間查詢不能像低維數據集一樣有效地優化,從而將其有效地轉化爲強力搜索。
NB嘲笑維度,因爲它基本上忽略了維度。許多決策樹變體在處理高維數據方面也很好。 kNN不喜歡高維數據。期待等待很長時間。
相關問題
- 1. R knn大型數據集
- 2. 解析 - 上傳數據有時需要永遠也寫不完
- 3. Asynctask永遠不會完成
- 4. CircleCI永遠不會完成
- 5. Weka Apriori算法轉換數據集
- 6. Symfony2,關於對象集合的print_r永遠不會完成
- 7. 如何在j48算法內注入IBk(knn)? (weka,java)
- 8. Grails事務永遠不會完成
- 9. AFNetworking AFJSONRequestOperation和filedata永遠不會完成
- 10. Rx-Kotlin awaitTerminalEvent永遠不會完成
- 11. Android AsyncTask永遠不會完成
- 12. Netty綁定ChannelFuture永遠不會完成
- 13. AsynchronousSocketChannel#讀取永遠不會完成。
- 14. GraphRequest永遠不會提高完成
- 15. PHP exec背景永遠不會完成
- 16. golang sync.waitgroup永遠不會完成
- 17. OpenCV Haartraining不會永遠完成
- 18. graphviz問題永遠不會完成
- 19. GGTS - SVN簽出永遠不會完成
- 20. Android 1.5 Gradle Sync永遠不會完成
- 21. 保存()永遠不會完成
- 22. RxJS訂閱永遠不會完成
- 23. PostgreSQL - 羣集永遠不會完成 - 長鍵?
- 24. 初始化mongodb副本集永遠不會完成
- 25. 副本集永遠不會完成克隆主節點
- 26. 自動完成在YUI在IE6上的大數據集
- 27. weka在一個大的arff數據集文件上運行
- 28. 鄰居數KNN算法
- 29. jQuery的自動完成遠程數據源JSON不回來我一直在這永遠的工作數據
- 30. 虹膜和大豆數據集上的id3算法試驗在Weka中給出錯誤
感謝您的回覆和評論,這是一個非常有用的見解,並且在距離測量方面有很多意義。我很可能會選擇一個不同的算法,因爲我希望能夠對這些組進行大量的運算。再次感謝你。 – RedMassiveStar
你好,就像更新一樣,我讓算法在F#中運行完成,到目前爲止,順序時間平均在53小時完成。所以它最終完成:-)。 – RedMassiveStar