我遇到了如果我用java api加載模型並做了預測,第一個預測時間比其他任何其他時間都要長得多。有一些懶東西的評價,我的意思是模型的權重沒有加載到第一個預測?這背後的原因是什麼?Tensorflow java api - 第一預測時間與第二或更多
try (Session s = load.session()) {
Tensor result = null;
startTime = System.nanoTime();
result = s.runner().feed("input", data).fetch("prediction").run().get(0);
endTime = System.nanoTime();
System.out.println(String.format("First prediction performance: %.4f ms", ((double)endTime - startTime)/1000000));
startTime = System.nanoTime();
result = s.runner().feed("input", data).fetch("prediction").run().get(0);
endTime = System.nanoTime();
System.out.println(String.format("2nd prediction performance: %.4f ms", ((double)endTime - startTime)/1000000));
System.out.println(result.toString());
}
- 首先預測性能:10.6066毫秒
- 第二預測性能:0.4776毫秒
你使用的CPU或CPU? – Wontonimo
我正在使用cpu。其實我很確定,我喜歡第二個和更多預測的計算時間。只是想確定我正確地測量它。 – kecso