2017-06-04 98 views
1

我一直在使用numpy的genfromtxtTensorflow numpy的,以tensorflow

csv_file = np.genfromtxt(args.dataset, delimiter=',',skip_header=1,usecols=(0,1,2,3,4,5), dtype=None)

疑問句讀csv文件:如何使用string_input_producer排隊和批處理文件。

+0

告訴一下產生的'csv_file'數組。 dtype,形狀? – hpaulj

+0

@hpaulj '>>>類型(csv_file) <類型 'numpy.ndarray'>' 'csv_file.shape (37810,)' 該CSV具有以下字段 '文件名\t註釋標籤\t左上角X \t左上角Y \t右下角X \t右下角Y' –

+0

'dtype'?這個形狀是1d,所以我懷疑它是一個具有多個「字段」而不是列的結構化數組。 'dtype = None'給你這個。 'tensorflow'對於使用結構化數組有什麼意義? – hpaulj

回答

0

您可以像CSV一樣從CSV中讀取Numpy數組,並將其手動分割爲批處理。但是,TF具有從多個CSV文件讀取並將行放在隨機或連續批次中的內置功能。您可以讀取不同數據類型的單元格,並根據需要將它們轉換爲相關的數據類型。根據您的需要 Converting TensorFlow tutorial to work with my own data

簡而言之,你需要的關鍵功能是tf.TextLineReadertf.train.string_input_producertf.train.shuffle_batch,或tf.train.batch,:

工作代碼做,這是在這個問題上的討論。

我知道該方法的唯一限制是您的CSV文件中的行應該具有相同的長度。