2
在CNTK文本格式中,序列ID是可選的。我想知道在訓練過程中如何使用序列ID。當從具有序列id的CNTKTextFormat創建minibatch時,是否將CNTKTextFormat中的行視爲一個樣本,或者將具有相同序列id的所有行視爲一個樣本?CNTK在訓練過程中如何使用序列ID?
在CNTK文本格式中,序列ID是可選的。我想知道在訓練過程中如何使用序列ID。當從具有序列id的CNTKTextFormat創建minibatch時,是否將CNTKTextFormat中的行視爲一個樣本,或者將具有相同序列id的所有行視爲一個樣本?CNTK在訓練過程中如何使用序列ID?
如果給出ID,則具有相同序列ID的所有行一起形成一個訓練實例(以CNTK術語:它們形成由樣本組成的序列)。
如果缺少ID,則每一行都是一個新的訓練實例(由具有單個樣本的序列組成)。
謝謝。跟進問題,訓練實例是否意味着同一訓練實例中的所有樣本必須按順序排列,不能分割或更改順序?是由樣本計數還是訓練實例計數定義的小批量大小?例如,如果一個序列有50個樣本,並且小批量大小設置爲32,這是如何工作的? – dragon