我有一些數據,如下面:隨機森林機器學習支持字符串字符嗎?
username, password, valid
kramer, abcd1234, 1
dan,123123123,0
,你可以看到數據的字符可以是字符串。所以scikit-learn.RandomForestClassifier返回錯誤如
ValueError: could not convert string to float: 'hEZ7P|N*Akem'
我在考慮兩種解決方案。浮動
- 變化串,因爲它們可以通過ASCII
- 找到另一個algothrim支持字符串特徵來表示。
哪一個更好?你能提出一些建議嗎?
這些算法需要數字輸入。你的目標是什麼? –
我想學習機器學習。所以我設計了我的用例。我創建了一些數據包括user_name,密碼和有效的。有效與否取決於密碼。我嘗試從我的數據中放出algothrim列車。但我發現algothrim無法處理字符串。所以我在這裏問 –
我認爲機器學習不是要走的路。如果您使用密碼來驗證某些內容,那麼這只是直接的邏輯 - 不需要統計推斷。 –