我想在TensowFlow上實現一個通用模塊,該模塊接收TensorFlow模型列表(此處表示爲專家),並從該混合專家中構建,如下圖所示: http://www.aclweb.org/anthology/C16-1133TensorFlow上的專家混合
所以該模型得到,其被饋送到不同的專家以及對選通網絡的輸入x
。最終輸出對應於ensemble output
,它由來自不同專家的輸出的總和乘以來自門控網絡的相應門控功能gm
給出。所有的專家網絡都是同步訓練的。
該模塊適用於批量培訓很重要。我正在尋找已經實施的東西,發現這個https://github.com/AmazaspShumik/Mixture-Models,雖然它不在TensorFlow上。
所以現在我正在尋找關於構建這個模塊的最佳方法的指針和建議,即關於某些已經實現的TF層或包裝器,它們將特別適合於此應用。