2011-10-27 98 views
0

我一直在研究http://www.hackerfactor.com/blog/index.php?/archives/432-Looks-Like-It.html&comment-submitted#feedback的例子,我試圖在處理完圖像後創建一個散列。如果您對從圖像像素創建的二進制字符串進行散列,然後查看漢明距離來分析照片的不同,創建哈希距離的哈希值與對原始二進制字符串做漢明距離有什麼區別?散列創建僅僅是爲了加快速度?爲什麼在感性散列中創建散列?

我不太瞭解哈希。我假設在這種情況下,它們是用於幾乎相同照片的過濾機制?但是這不是通過縮小照片並將其轉換爲灰度來實現的嗎?

回答

1

博客文章中提出的想法是如何識別類似的圖片。目標是丟失正確的信息,以便留下的是重要且易於比較的信息。所以有兩個方面:你可以比較多快和多準確。如果您將圖片縮小爲8x8黑白(即64位信息),那麼將其稱爲「原始咬字符串」或「長哈希」並不重要(正如@Blender指出的那樣這個術語在傳統使用中並不是真正的散列)。重要的是如何減少它,留下什麼信息和丟失什麼。