我有一個包含許多簡歷的數據庫,包括性別,年齡,地址,受教育年限的結構化數據以及每個人的許多其他參數。從CV進行預測
對於約10%的樣本,我也有關於他們在某個時間點所做的某些操作的額外數據。例如,Jane於1998年7月獲得了住房貸款,或者John於2007年1月開始了飛行員培訓,並於2007年12月獲得了執照。
我需要一種算法,對於每個操作,在將來的時間增量中,每個人會發生的概率。例如,比爾2011年住房貸款的機會爲2%,2012年爲3.5%等。
我應該如何處理這個問題?迴歸分析? SVM?神經網絡?還有別的嗎?
有沒有甚至有一些標準的工具/庫,我可以使用只是明顯的自定義?
不要試圖自己做這個。僱用有體面的統計培訓的人。 – 2010-09-18 21:25:05
它被稱爲水晶球算法。 – 2010-09-18 21:25:37
我想這也很大程度上取決於你有多少記錄(以及這些記錄有多麼具有代表性),你實際上可以推斷出有用的預測。 – Archimedix 2010-09-18 21:42:10