我有一個Keras模型,它正在對Raspberry Pi(帶相機)進行推理。 Raspberry Pi有一個非常慢的CPU(1.2GHz),沒有CUDA GPU,所以model.predict()
階段需要很長時間(〜20秒)。我正在尋找儘可能減少這種情況的方法。我試過了:加快Keras模型的推理
- 超頻CPU(+ 200 MhZ),並獲得了幾秒鐘的性能。
- 使用float16而不是float32's。
- 儘可能減少圖像輸入大小。
在推理過程中,我還能做些什麼來提高速度嗎?有沒有辦法簡化model.h5並降低精度?我已經用簡單的模型取得了成功,但是對於這個項目我需要依賴現有的模型,所以我不能從頭開始訓練。
你的模型架構如何? –
@FábioPerez非常複雜。 VGG16然後是一個雙重結構,其中兩個路徑都是30層+,然後在最後連接起來。這是預訓,所以afaik我無法調整模型結構。 – megashigger
由於最終的大型完全連接層,VGG的推斷很慢。使用更快的網絡,如MobileNet。 –