-1
我是機器學習領域的新手。 試圖用他們的電話記錄對10個人進行分類。如何用非直接數據分類
的電話通話記錄看起來像這樣
UserId IsInboundCall Duration PhoneNumber(hashed)
1 false 23 1011112222
2 true 45 1033334444
用這種8700個原木與SVM從sklearn訓練有素給出的結果是準確度88%
我有幾個關於這個結果的問題和
什麼是使用一些非序號數據的正確方法(例如電話號碼)
- 我不確定使用散列電話號碼作爲功能,但這種多類分類器的準確性並不差,這只是一個巧合嗎?
- 如何使用非oridnal數據作爲功能?
- 如果此分類器需要分類更多1000個類別(更多1000個用戶),SVM是否仍然適用於該情況?
任何建議對我很有幫助。謝謝