用圖像訓練的人工神經網絡

我有興趣使用Microsoft Kinect創建一個能像筆一樣檢測物體的軟件。我回憶了100張正面照片和200張負面照片，以便通過人工神經網絡拍攝。我的問題是：如何將這些圖像轉換爲ANN的輸入？我猜最後一層有一個神經元，因爲一個輸出是否是筆，我猜輸入也是一個，我想總共使用3層。但我不知道我是否應該將矩陣中的正面和負面圖像轉換成圖像，或者我能做些什麼？用圖像訓練的人工神經網絡

來源

2014-02-15 Johana

首先，歡迎來到Stackoverflow！

我從來沒有親自處理使用Kinect進行圖像識別，但是如果可能的話，您應該將圖像縮小到相當合理的大小，例如100x100，以便它仍然可以管理。

您還應該嘗試將圖像轉換爲grayscale，因爲這也有助於提高計算效率和開發時間，並且比RGB更容易開始使用。

輸入層將不是是1，這是給定的。如果我們指的是尺寸爲100x100的圖片，則輸入的總數應爲10000，每個像素一個。請記住，您正試圖儘可能細化數據，以便ANN可以檢測數據中的模式。

輸出層實際上應該有2 neurons，並有一個很好的理由。請記住，每個輸出神經元正在測量輸入屬於相應類別的可能性。通過擁有2個神經元，每個神經元可以代表積極的類（是的，這是一支筆）或負面的類（不，這不是筆）。因此，通過擁有2個神經元，您可以獲得圖像屬於該類的概率，然後您可以選擇最高值作爲答案。

3總層數應該足夠了，你可能永遠不需要更多。有一些非常好的文章可供您確定要使用的圖層數量，例如this one 我希望這有助於您！如果您還有其他問題，請告訴我。

來源

2014-02-15 14:54:19 Alejandro

如果我用裁剪圖像訓練ANN（僅包含我想識別的對象）我應該裁剪圖像以測試ANN嗎？ – Johana

你必須這樣做，否則它不起作用，因爲輸入圖層應該是像素數量的圖像大小。 – Alejandro

但是，如果我訓練ANN的圖像，我想要識別的圖像是在圖像的中心，當我顯示的圖像，該對象是在左邊可以ANN認識到？因爲我有一個問題，我告訴你ANN只識別對象，如果我裁剪圖像留下物體，我想識別 – Johana

用圖像訓練的人工神經網絡

回答

相關問題