2017-09-07 55 views
0

讓假設我有一個數據結構如下:是否有可能應用上的數據集的預測具有較少特徵

ID,特徵1,特徵2,特徵3,結果

的所有功能都有歷史數據。

但是預測需要在只有ID,特徵1,特徵2可用的階段完成。

如何利用歷史數據中的特徵3來建立一種預測(預測結果)?

這個假設是否正確?還是有什麼策略可以採用。

預先感謝您

回答

0

如果有足夠的數據,嘗試(使用列車,測試,例如每分)在所有3個特徵進行比較的型號VS只有1 & 2由該集合內的完全預測。從那裏你可以看到哪裏 - 以及如何 - 第三個功能給你一個優勢。然後,您可以使用該信息來校準2特徵預測器並將其應用於實際評分集。

+0

Thank you @ dominic111爲您的答案,但如果feature3具有預測價值在這種情況下應用只有功能1和2的預測值?有沒有一種方法來設計功能3,以便永久注入它的轉換? – moufkir

+0

您可以使用其他變量來預測它可以讓您瞭解您的2個其他功能如何產生錯誤。要說清楚,我認爲在絕大多數情況下,這很難解釋,但如果你想嘗試一下,你可能會發現一些關於錯誤模式的見解。 – dominic111

+0

您能否給我舉一個錯誤模式的例子,我是DS領域的新手,需要更多的見解。謝謝 – moufkir

相關問題