1 下面是該過程: 首先,你必須建立一個字典 首先,你必須在訓練圖像應用採樣(密集/關鍵點)。簡單地將圖像分解成等分採樣的補丁。 對所有訓練圖像重複上一步。然後,對於每條路徑,計算導致128-D向量的SIFT描述符。 對所有圖像的所有補丁執行上述步驟將產生一組128-D特徵向量。將這些描述符聚類爲K個羣集並保存其中心。這些中心形成您的模型的視覺詞典。 構建的視覺字典之後 應用在目標上的圖像的採樣(密集/關鍵點)。 爲查詢圖像的每個補丁計算SIFT特徵描述符。 檢查任何補丁位於哪個羣集。選擇這些集羣的中心(視覺詞)作爲該補丁的代表。 計算目標圖像中每個特定視覺詞彙數量的直方圖。該直方圖是圖像的描述符/表示。 這樣做對於所有的訓練集,您可以訓練任何現成的分類器來分類圖像。 這裏是管道的可視化: 來源 2015-10-17 20:16:30 Saeed