2015-10-13 73 views
-2

我正在研究經濟數據,解釋有關經濟週期的行業行爲。對於每個行業我都有30個獨立因素。我的Y解釋變量是每週股票收益。因素的特點是:適用於多條件變量的機器學習算法?

  • 一些在解釋我的Y的短期噪音因此,他們在線性模型體面執行與Y相關,良好。
  • 一些在特定時期有很好的意義,因此它們對於我通過例如卡爾曼濾波估計進行動態估計時的某些月份或年份是有意義的。
  • 最後,通過對空調甚至三倍的空調工作時,似乎有些樣品中,realeavant。 (例如,當x1爲正數且x2爲負數時,Y強烈顯着爲負數,但在任何其他情況下均不顯着)。

我努力以最後一種類型(多個特定變量)的強健方式進行模式化。我考慮使用支持向量機,神經網絡或樹算法,但我不確定現在是否最好。

我的問題是:什麼算法,你會推薦給解釋第三類型的現象?你會推薦什麼算法(如果有的話)來解釋其中的3個?

回答

0

你想要發現特徵對和三元組嗎?我會用隨機森林攻擊第三個;這些協會應該在「成功」的樹木中表現出密切聯繫。你也可以嘗試減少功能;與其他一兩個緊密相關的變量將被支配和移除。

而且,你有沒有考慮一個FFT(快速傅立葉變換)來分析觀察週期性的噪聲?

我不能推薦任何一種算法來解釋所有三種現象。首先,你沒有給我們任何描述數據的形狀和紋理。其次,現有的分析模型幾乎可以肯定是過於簡單和普遍的,一次就可以進行如此深入的分析。

+0

非常感謝@Prune。我會第一次去隨機森林,以配對和三倍調節的方式出來。一旦我做完了,我會盡快回復你。 – ylnor