2

我是機器學習的新手。我使用機器學習的概念得到了一個圖像中車輛總數的任務。我正在使用神經網絡。這裏給出我最糟糕的例子。用機器學習計算圖像中車輛的數量

Traffic Image

我需要從這個圖像發現汽車的總數量。我的想法是將這個大的圖像切成小塊的圖像,並訓練網絡來計算來自小塊的車輛。每個補丁的計數都小於5.然後在處理新圖像時,我可以使用滑動窗口來獲取車輛總數。

我只想知道這個想法是否可行或者我應該去做特徵提取和訓練神經網絡與這些功能。如果可能的話,數據集和培訓是否有任何條件。

回答

4

你在找什麼叫做object detection。起點可以是Deep Neural Networks for Object DetectionRegion-based Convolutional Networks for Accurate Object Detection and Segmentation

一個類似的,但更困難的任務是實例分段。我在這方面見過的最新論文之一是Pixel-level Encoding and Depth Layering for Instance-level Semantic Labeling

實例分割可能是計算機視覺中最難的任務。當你剛剛接觸機器學習/計算機視覺時,你可能首先想要做圖像分類。如果你想進入實例分割的方向,那麼你應該繼續進行語義分割,然後進行實例分割。

一個簡單的滑動窗口的方法,你只能預測「汽車」/「沒有汽車」將無法正常工作,因爲在圖像中汽車沒有被任何「無車」隔開。

+0

謝謝Martin ...但是如果我們使用滑動窗口,那麼它將只能從一個補丁識別單個車輛,我們不?我實際上需要從圖像中計算汽車總數。這就是爲什麼我認爲用圖像訓練一個網絡,它的數量會很好。另外,我認爲滑動窗口方法需要花費很多時間來處理圖像。 (我沒有讀過這些內容,我會閱讀並感謝您發送) –

+0

使用滑動窗口方法處理圖像所需的時間很大程度上取決於步幅,窗口大小和網絡的複雜程度。對於小型網絡/大步跨越,可以在不到30ms的時間內處理1400px x 600px的圖像。 –

+0

好的馬丁..這很有幫助。但我只想知道一個使用圖像補丁和相應車號進行訓練的網絡是否可以直接預測測試補丁的車輛數量? –