2015-10-13 42 views
1

在圖像分類中,我必須對視覺詞彙表示中的圖像進行編碼並訓練SVM分類器。製作圖像的視覺詞語編碼包的過程是什麼?一包視覺詞語編碼過程

回答

1

下面是該過程:

首先,你必須建立一個字典

  1. 首先,你必須在訓練圖像應用採樣(密集/關鍵點)。簡單地將圖像分解成等分採樣的補丁。
  2. 對所有訓練圖像重複上一步。然後,對於每條路徑,計算導致128-D向量的SIFT描述符。
  3. 對所有圖像的所有補丁執行上述步驟將產生一組128-D特徵向量。將這些描述符聚類爲K個羣集並保存其中心。這些中心形成您的模型的視覺詞典

構建的視覺字典之後

  • 應用在目標上的圖像的採樣(密集/關鍵點)。

  • 爲查詢圖像的每個補丁計算SIFT特徵描述符。

  • 檢查任何補丁位於哪個羣集。選擇這些集羣的中心(視覺詞)作爲該補丁的代表。

  • 計算目標圖像中每個特定視覺詞彙數量的直方圖。該直方圖是圖像的描述符/表示。

  • 這樣做對於所有的訓練集,您可以訓練任何現成的分類器來分類圖像。

    這裏是管道的可視化:

    enter image description here