我有一個灰度圖像,未知頻率上的handwriten數字(0-9)。圖像迴歸具有未知數量的目標/標籤
我試圖確定一個構建機器學習模型:
- 的X,Y座標的每一位。
- 數字標籤(即0-9)。
例
(我不能上傳灰度圖像,所以假設.
表示 「黑色背景」,並且數字代表本身):
Image1: Image2: Image3:
7....... .2...... ........
........ .....3.. ........
....1... ........ ........
........ ....2... ........
因此,讓f
表示我應該具有的機器學習模型/功能:
f(Image1) = [ label0:[], f(Image2) = [ label0:[], f(Image3) = [ label0:[],
label1:[(x=4,y=2)], label1:[], label1:[],
label2:[], label2:[(x=1,y=0), label2:[],
(x=1,y=3)],
label3:[], label3:[(x=5,y=1)], label3:[],
label4:[], label4:[], label4:[],
label5:[], label5:[], label5:[],
label6:[], label6:[], label6:[],
label7:[(x=0,y=0)], label7:[], label7:[],
label8:[], label8:[], label8:[],
label9:[], label9:[], label9:[],
]
我試圖應用深度學習方法使用Keras來同時解決這兩個問題,但我努力設置我的標籤,因爲每個圖像都有未知數量的標籤。
任何人都有關於如何設置這樣一個深度學習問題的任何想法?我應該將問題分成2個階段(位置然後分類 - 但是然後位置問題仍然有未知數量的標籤)?謝謝!