我的圖像存儲服務器有一個非常大的問題。類似的圖像搜索解決方案
它上面有大約2,000,000個產品圖片,並且不斷增加,但其中很多都非常相似。例如:一張120 * 120,118 * 120,131 * 125等多種相似尺寸的iPad照片,他們在我的網站(庫中的相似圖片)上佔用了大量不必要的磁盤空間和不良用戶體驗。
這些圖片已收錄在數據庫中,我可以通過產品找到他們提供一些條件,比如,類別等。我需要找到一種方法,以紀念在數據庫中的這些類似的圖像,並刪除它們。
我所做的: 找到一個名爲pHash的庫可以計算兩個圖像的相似度,我可以用它來逐個計算圖像。但以這種方式,需要很長時間才能找到這些圖像。現在我不知道如何讓這個過程更快。
任何想法?
感謝@eznme,感性哈希是一個很好的選擇! – opps 2011-03-10 10:24:27
您能否詳細說明我可以如何對散列值進行排序? – retiremonk 2016-01-28 17:23:02