2016-03-21 78 views
0

我想知道是否可以將分類技術(如Logistic迴歸)應用於其變量/預測變量按時間「索引」的數據。或者,如果不是,哪種分類技術適用於這些類型的數據。如果我有一個因變量Y,其值爲0或1(對於二進制案例分類)或1,2,3,...(對於'多'分類)。對時變預測變量數據的Logistic迴歸(分類技術)

而且我這是 '索引' 的時間,即,X1T1,X1T2,...,X1Tn,X2T1,X2T2,...,X2Tm,... XpTk,

,其中預測變量

X1T1 = values of variable X1 at time 1 (T1) 
X1T2 = values of variable X1 at time 2 (T2) 
    . 
    . 
X1Tn = values of variable X1 at time n (Tn) 
X2T1 = values of variable X2 at time 1 (T1) 
X2T2 = values of variable X2 at time 2 (T2) 
    . 
    . 
X2Tm = values of variable X2 at time m (Tm) 
    . 
    . 
    . 
XpTk = values of variable Xp at time k (Tk) 

其中n,M,K = 1,2,...(可變的時間 '索引') p = 1,2,...(預測變量的#)。

對於數據視圖,我們有;

Obs Y X1T1 X1T2 ... X1Tn X2T1 X2T3 ... X2Tm ... XpTk 
    1 .  .  .  .  .  .  .   . 
    2 .  .  .  .  .  .  . ... . 
    . 
    . 
    . 
    N .  .  .  .  .  .  . ... .  

我可以申請對這些類型的數據的分類技術,就好說了,Logistic迴歸(或像基於樹的方法「多」範疇響應變量其他分類技術。)非常感謝!

回答

0

您可以使用您的數據來擬合Logistic迴歸模型。 但是,結果可能不太好,因爲算法會獨立考慮每個變量。

使用你的數據來擬合LR模型的一種方法是創建新的變量,這些變量可以被認爲是彼此獨立的,並且保留足夠的信息來表示你的原始數據。

例如)

newvar1 = mean(X1T1, X1T2, ..., X1Tn), 
newvar2 = sd(X1T1, X1T2, ..., X1Tn), 
newvar3 = mean increasing ratio(X1T1, X1T2, ..., X1Tn) 
... 

這樣,您就可以使用您的數據,以滿足LR模型,儘管新變量的例子是不夠的。

相關問題