我有100個學生的四節課的數據集(例如,課a,課b,課c,課d),讓我們想象這個等級與 課程的等級相關聯。幼稚bayes預測分數
我想通過那四年級來實現樸素貝葉斯預測成績課f,但我不知道如何使用輸入。 我讀了樸素貝葉斯垃圾郵件檢測,並在此,每個字的可能性計算。 但是對於等級我不知道我必須計算的可能性。 我已經嘗試過垃圾郵件,但是對於這個例子,我只有四個名字(每個課程)
我有100個學生的四節課的數據集(例如,課a,課b,課c,課d),讓我們想象這個等級與 課程的等級相關聯。幼稚bayes預測分數
我想通過那四年級來實現樸素貝葉斯預測成績課f,但我不知道如何使用輸入。 我讀了樸素貝葉斯垃圾郵件檢測,並在此,每個字的可能性計算。 但是對於等級我不知道我必須計算的可能性。 我已經嘗試過垃圾郵件,但是對於這個例子,我只有四個名字(每個課程)
爲了做出好的分類,您需要有一些關於學生的信息,而不是他們正在上課。以你的例子爲例,垃圾郵件檢測是基於單詞,停止通常是垃圾郵件(購買,促銷,金錢)或來源於http頭文件。 對於預測學生成績的情況,你可以想像有關於學生的信息:社交課,他是做運動,男性還是女性,等等。
回到你的問題,這不是有趣的課程名稱,而是每個學生在課堂上的成績。你需要對每四堂課和f課進行評分,以訓練樸素貝葉斯分類器。
你的條目可能看起來像:
StudentID gradeA gradeB gradeC gradeD gradeF
1 10 9 8 5 8
2 3 5 3 8 8
3 5 3 1 1 2
4 10 10 10 5 4
訓練你的分類後,你將通過新進入一個新的學生那樣:
StudentID gradeA gradeB gradeC gradeD
1058 1 5 8 4
分類器將能夠預測檔次對於F課,考慮到了先前的成績。
您可能已經注意到,我打算在gradeF與gradeD高度相關的情況下做了一個訓練數據集。這就是貝葉斯分類器試圖學習的內容,只是以更復雜的方式。
歡迎來到本網站。本指南可以幫助您簡化您當前非常廣泛的問題:[問]。 – mins 2015-03-19 06:33:09