2016-11-05 71 views
0

我有一個包含每個車輛邊界框(寬度,高度,角度,x軸,x軸,x軸)的txt文件的10 jpeg高質量航拍圖像的數據集。這是一個例子:如何爲圖像處理創建訓練數據集

@CATEGORY:GENERAL 

@IMAGE:2012-04-26-Muenchen-Tunnel_4K0G0010.JPG 

#format: id type center.x center.y size.width size.height angle 

0 30 1319 2338 35 11 56.451578 

1 30 1337 2350 42 14 57.817368 

2 30 224 3556 61 20 136.967797 

我應該如何創建使用來自Caffe車輛的數據庫在神經網絡訓練? 我是否應該使用photoshop來裁剪每輛車並逐一保存?或者可以使用txt文件創建不同類別的車輛在網絡中訓練...... Matlab

+0

如果你只有10張照片,你可以通過在Photoshop中使用本手冊更快,但如果你想要你可以使用圖像庫來獲取這些文件 – Maaaaa

+0

感謝你的回覆。有10張圖片,但有很多車輛在其中。我說的是成千上萬..我是否必須將每輛汽車的確切邊界分開,或者只是圍繞它的邊界框就足夠了? –

回答

0

有了這麼多的車輛,我不會用手去做。在Python中,您可以將圖像加載到一個numpy數組中,然後使用文件中提供的數據選擇框。你可以通過旋轉整個數組來處理角度,然後用與選擇'正常'相同的方式選擇框。

如果您使用的是不同的編程語言,您應該可以遵循這種方法,您只需將jpeg轉換爲位圖並以某種方式將其轉換爲數組即可。

我不知道咖啡,但通常需要捕捉確切的咖啡因,因爲神經網絡需要相同大小的盒子。

相關問題