2011-03-11 61 views
3

我需要確定較大圖像內較小圖像的存在。圖像的模糊匹配部分

比賽必須模糊,最好我應該知道它的匹配程度如何(%),但是如果需要,我可以在比賽完成後計算出我自己的準確性。

我的目標是將FFT(快速傅里葉變換)譜圖(音樂中的頻率可視化)與原始音樂曲目相匹配。我匹配的小圖像只是原始軌道的一個子集(包括時間和頻率範圍)(如下圖所示)。

我應該從哪裏開始?用於物體識別的相同算法是否適合此任務?我主要查找C#/ .net庫/示例,但也查找有關實現和問題/陷阱的信息。

我正在考慮使用人工神經網絡來訓練識別。有什麼想法嗎?

的圖像我要配什麼例子可能看起來像: http://img812.imageshack.us/img812/548/musicspectogram2.png

回答

0

我認爲把這個問題當作圖像識別問題忽略了問題的底層結構。具體來說,你可能想看看Shazam如何解決這個問題。在Quora上這個問題有幾個有趣的鏈接:

http://www.quora.com/How-does-Shazam-work

首先,an academic paper描述的算法。你會注意到他們也是從一個光譜圖開始的,但是從那裏選擇一些適合問題的算法來選擇一些地標。然後他們基本上將它用作指紋識別到數據庫中。

其次,an article on Slate這是可以理解的更高層次,但可能仍然有幫助。

+0

我最終自己實現了這一點,並且我使用了與Shazam相同的一些技巧。如果我已經看到了這一點,它可以很大程度上緩解這個過程(不必經過它))。我正在考慮製作一篇描述我的方法的博客文章,我確信它不會破壞任何Shazam專利。 – 2011-04-14 16:43:37

0

的圖像相關可能工作。取決於你的完整圖像和部分圖像之間的差異。

例在數學:

enter image description here

如果您發佈一個全部和部分圖像的完整的例子,也許我們能想出更多。

還存在其他替代方案:比較FFT和做小波分析,僅舉兩個例子。