-2
我有CSV problem.csv 3個數據集與屬性:製作預測用戶是否就能解決的事,或不
- ID
- 水平
- 準確性
- solved_count
- error_count
- tag1
- tag2
- TAG3
- TAG4
- tag5
Submission.csv與attibutes:
- USER_ID
- PROBLEM_ID
- solved_status
user.csv與
- USER_ID
- solved_count
- 嘗試
我想現在的測試數據集用戶是否就能解決問題或無法預知。
我在考慮應用樸素貝葉斯分類。但我不知道如何解決這個問題。我想我必須在Weka或sckit學習中使用通用數據集。給我一些關於如何解決這個問題的想法。
我已經加入了表格。你建議哪種算法? –
您可以選擇不同的分類器。最常見的是j48,隨機森林,樸素貝葉斯,knn,svn。檢查所有這些,並採取最好的結果。 –