-2
我想建立一個先進的深度學習模型(例如:使用注意力的模型),並在Android手機上使用它(當然不需要培訓),我只會用它進行推理。
我想要一個庫,可以做到這一點,並可以壓縮模型的大小,以在手機或Android上使用。
您是否知道任何類似於我的目標的項目或應用程序?哪個深度學習庫支持在手機上使用的深度學習模型的壓縮?
我想建立一個先進的深度學習模型(例如:使用注意力的模型),並在Android手機上使用它(當然不需要培訓),我只會用它進行推理。
我想要一個庫,可以做到這一點,並可以壓縮模型的大小,以在手機或Android上使用。
您是否知道任何類似於我的目標的項目或應用程序?哪個深度學習庫支持在手機上使用的深度學習模型的壓縮?
有一個咖啡叉叫Ristretto。它允許壓縮神經網絡以降低數值精度(每個參數小於32位),同時保持高精度。 MXNet和Tensorflow現在也有這個功能。 Pytorch還沒有。這些工具允許減少存儲神經網絡參數所需的內存,但它們並不特定於Android。