2017-02-17 58 views
0

我有一堆訓練樣例文件在自定義格式id喜歡加載到tensorflow模型,但我無法弄清楚如何有效地解析數據。Tensorflow查看uint8張量作爲float32張量

這些文件有一個20字節的標題,描述了要素數量,標籤數量,示例數量等。標題後面是一些示例。每個例子都是一些代表特徵的float32s,後面跟着一些代表標籤的uint8s,所以文件的其餘部分是浮動和uint的交替模式。

我一直在使用tf.read_filetf.decode_raw將文件作爲uint8s的向量來獲取,現在id像切片標籤中的要素一樣,並以little endian順序將特徵向量視爲float32向量。這種事情有可能出現在張量流中嗎?

我已成功解析文件numpy,並將特徵和標籤轉換爲tf.constant s,但似乎將其直接加載到tensorflow中會更有效率。

回答

0

假設它是所有固定大小的數據,則需要使用Slicing and Joining運算符對數據進行解交織。然後,您可以在圖像數據上使用decode_rawout_dtype=tf.float32,並再次切片以分別獲取您的矢量。