我使用TensorFlow中的MNIST數據集訓練卷積神經網絡(CNN)。我從MNIST測試圖像計算每幅圖像的準確度並查找十個輸出節點的值。我用下面的代碼行得到它(在這裏看到的所有代碼:How to get the value from each output-node during eval MNIST testdata in TensorFlow?): pred=prediction.eval
我試圖實現softmax函數(Softmax的雅可比矩陣)的導數矩陣。 我數學知道使用SoftMax(XI)的衍生物相對於X 1是: 其中紅色增量是Kronecker符號。 到目前爲止,我所實行的是: def softmax_grad(s):
# input s is softmax value of the original input x. Its shape is (1,n)