1

我正在爲視頻分類創建一包視覺詞彙。我沒有使用SURF描述符,這就是爲什麼我不能使用OpenCV的BOWImgDescriptorExtractor用於此目的。 我提取了我的描述符,我自己將它們聚類。我現在有我的詞彙量(4000碼)。我應該做的是將我的訓練描述符分配給這些聚類,併爲下一步創建視覺直方圖。我應該如何做這個預測,併爲創建的字典中的訓練數據創建視覺直方圖?訓練數據集羣的BOW預測

回答

0

爲了將描述符分配給簇,必須選擇一個距離度量。一個簡單的選擇就是歐幾里德距離。然後,您需要計算從訓練描述符到每個聚類質心的距離,並將它們分配給質心比描述符更接近任何其他聚類的質心的聚類。

在您爲圖像上的所有訓練描述符完成此操作後,計算分配給每個羣集的描述符數量,然後構建直方圖。不過,對於訓練集中的所有圖像必須重複該過程。由於描述符的數量可能隨着圖像而變化,所以直方圖通常在作爲用於訓練的特徵向量饋入分類器之前被歸一化。