2017-01-11 98 views
1

我對機器學習相當陌生,但我正在尋求解決以下問題。這是一種逆向預測。 我有很多輸入,因此每個記錄一個輸出。因此,我可以輕鬆進行分類並預測未知新數據集的輸出。 我想解決的問題是獲取一個預期結果,並對輸入數據集進行分類,這將對預期的定義輸出產生極高的可能性。如何通過機器學習運行反向預測?

爲了使問題更加複雜,我希望能夠靈活地定義一些可能無法更改的輸入條件(例如男性/女性),並添加這些條件(如過濾器)並獲得新的Revers預測 - 什麼將成爲除給定預期和定義的結果之外最相關的重要輸入。

舉一個例子:我有成千上萬的學生記錄,包括教育等等,以及在10年工作經驗後他們賺取正常或極端的錢的信息。因此,如果我是一名新生,我可以根據自己的教育程度,性別,年齡,學習等等來賺取大筆金錢或平均水平,從而預測結果。 我想得到的是事實我是男性,在學位時期有預期的年齡,我應該研究什麼纔能有極高的可能性?

回答

0

這個問題並不是一個獨特的或最佳的解決方案,雖然它可以通過幾種方式解決IMO。

要理解的關鍵事實是,您有從矢量輸入到標量/分類輸出的信息丟失。由於多個非常不同的輸入向量可能導致相同的輸出值,因此稀釋信息組件,它不是「可逆」或「可逆」轉換。

說這個問題的一個可能的攻擊角度是聚集你的輸入矢量,爲每個輸出值獲得幾個相關的聚類。然後,您可以提取這些輸入聚類中心並檢查導致期望結果的這些原型值。這樣你就可以得到你想要的反向'輸入興趣點'。