我有一個正常的前饋網絡,產生一個矢量v。v的元素然後被用作稀疏矩陣M的非零條目(假設座標是預定義的)。稀疏矩陣然後乘以一個密集向量,並在結果標量上定義一個損失。我想反向傳播損失w.r.t.網絡的權重,這需要通過稀疏矩陣。通過稀疏張量反向傳播梯度?
這似乎是一個完全合理的用例的稀疏矩陣,但現在看來,這樣的功能是不支持的。事實上,即使調用tf.gradients(男,[V])產生一個錯誤:
AttributeError: 'SparseTensor' object has no attribute 'value_index'
難道我做錯了什麼,或我的假設,這個功能不(沒?)有正確嗎?如果是後者,那麼對於這種特殊的用例來說,是否存在一種解決方法,即重寫所有具有漸變定義的稀疏張量操作?