我想在這裏有一些專家指導什麼是我最好的方法來解決問題。我調查了一些機器學習,神經網絡和類似的東西。我已經調查過weka,某種baesian解決方案.. R ..幾個不同的東西。不過,我不確定如何真正開始。這是我的問題。最好的方法,我認爲是一個機器學習問題
我擁有或將擁有大量活動......最終大約有100,000人左右。每個事件由幾個(30-50)獨立變量和1個我所關心的因變量組成。在確定因變量的值時,一些自變量比其他自變量更重要。而且,這些事件與時間有關。今天發生的事情比10年前發生的事情更重要。
我希望能夠爲事件提供某種學習引擎,並讓它預測因變量。然後,知道該事件的因變量(以及之前發生的所有事件)的真實答案,我希望能夠訓練後續的猜測。一旦我瞭解了編程方向,我可以進行研究並弄清楚如何將我的想法轉化爲代碼。但我的背景是並行編程,而不是這樣的東西,所以我很樂意就此提供一些建議和指導。
謝謝!
編輯:這裏有一些關於我試圖解決的問題的更多細節:這是一個定價問題。假設我想要預測隨機漫畫書的價格。價格是我唯一關心的事情。但是有很多自變量是可以想到的。它是超人漫畫,還是Hello Kitty漫畫。多大了?什麼情況?等等。經過一段時間的訓練後,我希望能夠提供關於我可能正在考慮的漫畫書的信息,並讓它爲漫畫書提供合理的預期價值。好。所以漫畫書可能是一個虛假的例子。但你得到了一般想法。到目前爲止,從答案中,我正在對支持向量機和樸素貝葉斯進行一些研究。感謝您的所有幫助。
我認爲標籤「分類」和「迴歸」是互斥的。它可以是「分類」,也可以是「迴歸」。它不能兼而有之。 – 2009-05-20 08:48:26