2017-03-02 40 views
0

我正在使用R caret軟件包比較不同分類器對我數據的性能 。我想以量化性能解釋R caret軟件包中timingSamps選項的計時結果

的方法之一是要 能談談相對於其他分類每個分類 來觀察分類所花費的時間 東西。

我想通過在 trainControl中設置timingSamps選項給出的信息將允許我獲得我需要的信息。 雖然我不知道如何解釋它,但文檔對於實際測量的內容來說是相當不透明的。

相關的代碼位:

control <- trainControl(..., timingSamps=20) 
model <- train(..., trControl=control) 
model$timings 

輸出是:

> model$times 
$everything 
    user system elapsed 
800.774 2.713 804.273 

$final 
    user system elapsed 
3.323 0.007 3.335 

$prediction 
    user system elapsed 
0.017 0.000 0.016 

如何解讀預測時間? 一)時間來預測一個觀察 二)時間來預測一組觀察 三)別的東西完全

的文檔有這樣一段話:

timingSamps訓練集的樣本數將用於測量的時間預測 樣品(零表明該預測時間不宜估計。

但是,這並沒有告訴我如何解釋輸出。

回答

0

檢查train函數的源代碼表明,它是預測你在trainControl

相關源代碼(來自:https://github.com/topepo/caret/blob/master/pkg/caret/R/train.default.R)中指定的採樣數所用的時間

if(trControl$timingSamps > 0) { 
pData <- x[sample(1:nrow(x), trControl$timingSamps, replace = TRUE),,drop = FALSE] 
out$times$prediction <- system.time(predict(out, pData)) 
} else out$times$prediction <- rep(NA, 3) 
out