2015-03-19 35 views
1

我有100個學生的四節課的數據集(例如,課a,課b,課c,課d),讓我們想象這個等級與 課程的等級相關聯。幼稚bayes預測分數

我想通過那四年級來實現樸素貝葉斯預測成績課f,但我不知道如何使用輸入。 我讀了樸素貝葉斯垃圾郵件檢測,並在此,每個字的可能性計算。 但是對於等級我不知道我必須計算的可能性。 我已經嘗試過垃圾郵件,但是對於這個例子,我只有四個名字(每個課程)

+0

歡迎來到本網站。本指南可以幫助您簡化您當前非常廣泛的問題:[問]。 – mins 2015-03-19 06:33:09

回答

1

爲了做出好的分類,您需要有一些關於學生的信息,而不是他們正在上課。以你的例子爲例,垃圾郵件檢測是基於單詞,停止通常是垃圾郵件(購買,促銷,金錢)或來源於http頭文件。 對於預測學生成績的情況,你可以想像有關於學生的信息:社交課,他是做運動,男性還是女性,等等。

回到你的問題,這不是有趣的課程名稱,而是每個學生在課堂上的成績。你需要對每四堂課和f課進行評分,以訓練樸素貝葉斯分類器。

你的條目可能看起來像:

StudentID gradeA gradeB gradeC gradeD gradeF 
1    10  9  8   5   8 
2    3  5  3   8   8 
3    5  3  1   1   2 
4    10  10  10  5   4 

訓練你的分類後,你將通過新進入一個新的學生那樣:

StudentID gradeA gradeB gradeC gradeD 
1058   1  5  8   4 

分類器將能夠預測檔次對於F課,考慮到了先前的成績。

您可能已經注意到,我打算在gradeF與gradeD高度相關的情況下做了一個訓練數據集。這就是貝葉斯分類器試圖學習的內容,只是以更復雜的方式。