2016-04-05 41 views
0

如果我有兩個非常不同的數據集和兩種截然不同的分類技術,是否有一種合併兩個輸出的好方法?我知道一個平均值可能會有效,但是有沒有更相關的方法來做到這一點?我聽說過幾個概念,如提升和集成學習,這些都適用嗎?如何結合兩個機器學習算法輸出?

回答

2

有兩種常見的方法可以解決這個問題。第一個叫做的助推器使用加權投票來決定預測。主要想法是結合兩個分類器的優點。

第二種方法,稱爲堆疊,使用兩個分類器的輸出作爲特徵爲另一種分類器(可能具有其它特徵,例如原始的),和使用最終分類器的輸出用於預測。

在沒有進一步的細節,這是我可以給的最好的答案。

有關Stats.SE的更多信息,請參閱Bagging, boosting and stacking in machine learning