2011-12-31 20 views
0

我試圖使用明確的標題。我試圖達到的是我有一個數據列表如下使用WEKA根據輸入數據在給定的數據集中查找最佳可用數據?

ID - 人的ID,計算中不重要,但需要輸出以確定人 教育{1 = Degree,2 = Master,3 =博士}
CGPA - 從2.00的值,直到4.00
電腦= {1 =是,0 =否}(電腦知識)
海外= {1 =是,0 =否}(願意前往海外)

身份證,教育,CGPA,計算機,海外
001,3,3.14,1,0
002,1,3.68,1,1
003,2,2.76,0,1
..........
.........

說我有1000行有不同的值。我的目的是,我想給出類似的1行數據,並獲得1000行中最接近的記錄。我正在使用WEKA。

我正在嘗試做一些工作,如尋找特定工作的最佳簡歷。

我已經檢查並做了很多例子來更好地瞭解WEKA,但我無法完成它。我是WEKA的新手。我嘗試了分類器和決策樹,但沒有辦法。我能夠從給定的數據中獲得預測,但是我無法根據給定的輸入過濾數據列表。

任何幫助非常感謝。任何將我引導至任何有關此文章的鏈接,或任何想法,甚至任何單一的閃光都將有用。

回答

0

聽起來像你想使用最近鄰居分類器(Weka中的IBk)。如果你使用的是Weka GUI,你只能得到這個類,所以你必須實現一些代碼來檢索實際的最近鄰居。

看看this question的方法。