2012-05-01 101 views
0

比如我有這樣libsvm輸入數據?

userID 1 (or 2,3.....up to n) 
gender male (or female) 
working yes (or No) 
income >$5000/month (or <$5000) 
have_car yes (or no) 

我想預測一個人對其他性質的汽車或不基地(性別,工作和收入)爲n個人的數據集。我應該使用什麼樣的格式進行培訓,以及我應該培訓多少人,如果說我擁有10,000人的數據,有多少人用於測試

回答

0

格式:您必須使用數字數據。所以使用可以使用0和1進行二進制分割。

培訓/測試:沒有確切的公式。看起來你沒有很多用於分類的功能 - 這意味着你不一定需要大量的訓練數據。你可以將它分開50:50,並檢查你是否得到了合理的結果。