2014-02-15 78 views
3

我有興趣使用Microsoft Kinect創建一個能像筆一樣檢測物體的軟件。我回憶了100張正面照片和200張負面照片,以便通過人工神經網絡拍攝。我的問題是:如何將這些圖像轉換爲ANN的輸入?我猜最後一層有一個神經元,因爲一個輸出是否是筆,我猜輸入也是一個,我想總共使用3層。但我不知道我是否應該將矩陣中的正面和負面圖像轉換成圖像,或者我能做些什麼?用圖像訓練的人工神經網絡

回答

4

首先,歡迎來到Stackoverflow!

我從來沒有親自處理使用Kinect進行圖像識別,但是如果可能的話,您應該將圖像縮小到相當合理的大小,例如100x100,以便它仍然可以管理。

您還應該嘗試將圖像轉換爲grayscale,因爲這也有助於提高計算效率和開發時間,並且比RGB更容易開始使用。

輸入層將不是是1,這是給定的。如果我們指的是尺寸爲100x100的圖片,則輸入的總數應爲10000,每個像素一個。請記住,您正試圖儘可能細化數據,以便ANN可以檢測數據中的模式。

輸出層實際上應該有2 neurons,並有一個很好的理由。請記住,每個輸出神經元正在測量輸入屬於相應類別的可能性。通過擁有2個神經元,每個神經元可以代表積極的類(是的,這是一支筆)或負面的類(不,這不是筆)。因此,通過擁有2個神經元,您可以獲得圖像屬於該類的概率,然後您可以選擇最高值作爲答案。

3總層數應該足夠了,你可能永遠不需要更多。有一些非常好的文章可供您確定要使用的圖層數量,例如this one 我希望這有助於您!如果您還有其他問題,請告訴我。

+0

如果我用裁剪圖像訓練ANN(僅包含我想識別的對象)我應該裁剪圖像以測試ANN嗎? – Johana

+0

你必須這樣做,否則它不起作用,因爲輸入圖層應該是像素數量的圖像大小。 – Alejandro

+0

但是,如果我訓練ANN的圖像,我想要識別的圖像是在圖像的中心,當我顯示的圖像,該對象是在左邊可以ANN認識到?因爲我有一個問題,我告訴你ANN只識別對象,如果我裁剪圖像留下物體,我想識別 – Johana