1
我試圖將關於seq2seq模型的official tutorial輸入從佔位符轉換爲tfrecords,但主要原因是因爲如果我將所有樣本寫入單個tfrecord文件,我無法將具有相似長度的樣本分組到同一個存儲桶中,是否需要啓動四個隊列(桶的長度)來實現它?歡迎提供任何建議和解決方案如何爲桶設置seq2seq模型的tfrecords隊列?
我試圖將關於seq2seq模型的official tutorial輸入從佔位符轉換爲tfrecords,但主要原因是因爲如果我將所有樣本寫入單個tfrecord文件,我無法將具有相似長度的樣本分組到同一個存儲桶中,是否需要啓動四個隊列(桶的長度)來實現它?歡迎提供任何建議和解決方案如何爲桶設置seq2seq模型的tfrecords隊列?
新增的tf.contrib.training.bucket_by_sequence_length()
函數增加了對創建多個隊列的支持,以按照分段的序列長度進行分組,並將完整批次合併到一個隊列中。
非常感謝@ mrry,這個函數是否會被移出contrib模塊併成爲一個穩定的API? –
API可能會受到一些小的更改(例如,如果我們找到更簡單的方法來配置它),但功能將保持不變。 – mrry