2013-11-15 93 views
1

我在Rfaoutlier程序包中使用forward.search進行了異常值分析,但這樣做太長而沒有任何結果。我只是想檢查一下我是否做得對,並且我怎樣才能更快地完成這個過程(例如通過設置參數)。這裏的腳本:faoutlier分析時間太長

library(faoutlier) 

mydata.girls=read.table('data-girls.txt') 

model.mydata.girls <- 
'F1 =~ V1+V3+V5+V14+V19+V24+V28+V29+V31+V38+V40+V42+V44+V46+V48+V54+V63+V64+V65+V66+V69+V80 
F2 =~ V6+V9+V13+V17+V36+V37+V45+V49+V53+V56+V57+V60+V62+V67+V68+V71+V74+V75 
F3 =~ V4+V7+V11+V18+V25+V30+V32+V33+V35+V39+V43+V47+V50+V52+V77+V78+V79 
F4 =~ V10+V20+V23+V26+V34+V41+V58+V59+V70+V72+V73+V76 
F5 =~ V8+V22+V51' 

FS<-forward.search(mydata.girls,model.mydata.girls) 
+1

您的模型似乎具有接近無限的組合可能性。那麼你如何嘗試一個簡單的版本,其中'F1,... F5'各依賴於不超過兩個變量,並且看看會發生什麼。另外,您是否驗證過您手動構建的模型符合'sem :: specifyModel'輸出的結構? –

+0

你可能是對的。在此之後,我嘗試了'robustMD'方法,並且表示至少有一列的IQR爲零。我發現我的很多參與者對問題V12和V16回答爲零。我從分析中刪除了它們,至少robustMD起作用。 – ehsan88

回答

1

一些更好的優化被添加到0.4版本的CRAN現在,這更優化組織更大的數據集和支持,估計通過parallel包使用並行架構的所有型號。您可以使用setCluster()在估算期間使用所有可用的核心,我發現這將大幅縮短更大數據集的估計時間。希望有所幫助。

+0

其實,在我發佈這個問題之後,我發現我的代碼中存在一個問題,導致它運行時間過長。儘管如此,還有一些時候我運行代碼,希望它們可以通過使用其他CPU內核來加快速度。這對我來說非常有幫助。非常感謝。 – ehsan88