2017-03-07 20 views
0

我正在研究使用LDA(潛在Dirichlet分配)主題建模的基於內容的圖像檢索。我希望同樣使用Python。對於圖像數據集,我無法在LDA中找到任何庫/軟件包。 This包似乎只適用於文本語料庫。請在Python中爲圖像語料庫建議任何軟件包,或者請簡要列出爲圖像執行LDA所需的步驟。用於計算機視覺的Python中的LDA

回答

1

我最近使用LDA在基於視覺詞的python中實現了圖像檢索。有關詳細信息,請參閱我的github頁面。

可視字是圖像關鍵點處提取的圖像特徵的聚類中心。在這個例子中,密集的SIFT特徵是從40個不同人的10幅面部圖像(Olivetti面對數據集)中提取的。

使用小批量K-means將128維SIFT特徵聚類爲K個可視單詞字典。在線變分貝葉斯算法用於學習LDA主題模型並提取訓練圖像數據的主題比例。

然後將測試圖像數據轉換爲主題空間,根據列車主題比例與測試圖像之間的餘弦相似度檢索訓練圖像。