我的目標是認識上的航空照片建築物的足跡。聽說機器視覺方面的最新進展(ImageNet大規模視覺識別挑戰),儘管我可以(至少)嘗試使用神經網絡來完成這項任務。神經網絡拓撲
有人可以告訴我這個網絡的拓撲結構應該是什麼?我想它應該具有與輸入一樣多的輸出(這意味着圖片中的所有像素),因爲我想通過它們(至少近似)在圖片上的位置來識別建築物的輪廓。我猜輸入圖片應該是標準尺寸,每個像素歸一化爲灰度或YUV顏色空間(每種顏色1個值),也許標準化的分辨率(每個像素應該代表實際的固定尺寸)。我不確定圖片是否可以在輸入到網絡之前以任何其他方式進行預處理,也許通過首先提取邊緣?
棘手的部分是應該如何表示輸出以及如何訓練網絡。僅使用例如對於建築物佔地面積內的像素輸出= 0,對於其外部的像素輸出1,可能不是最好的想法。也許我應該教網絡識別建築物的邊緣,所以表示建築物邊緣的像素對於其餘像素應該有1和0。
任何人都可以提出有關網絡拓撲/輸入/輸出格式的建議嗎? 或者也許這個任務是絕望的困難,我有0個機會解決它?
這是一項艱鉅的任務。我嘗試用OpenCV和MATLAB分類器級聯檢測航拍圖像中的建築物,但效果不佳。我也嘗試使用Neuroph,並且它是Encog?但它再次工作得不好。我建議你先成功地訓練一個可以識別'這個圖像是建築物'或'這個圖像不是建築物'的網絡(圖像應該被剪裁到建築物)。 這可以讓你更好地開始艱鉅的任務。您還可以比較哪一種可以獲得更好的結果:識別邊緣檢測圖像或顏色。 – PawelP 2014-09-05 18:26:35