是否有任何提供「Shazam like」解決方案的開源音頻指紋識別解決方案?開源音頻模式識別(指紋打印)
Shazam使用Landmark digital的商業解決方案,但我正在尋找替代方案(即使精度和性能較差)的開源解決方案。
任何人都知道這樣的實現甚至發佈未實現的算法?
是否有任何提供「Shazam like」解決方案的開源音頻指紋識別解決方案?開源音頻模式識別(指紋打印)
Shazam使用Landmark digital的商業解決方案,但我正在尋找替代方案(即使精度和性能較差)的開源解決方案。
任何人都知道這樣的實現甚至發佈未實現的算法?
有幾個開放盡管您可能會忘記商業音頻識別服務(如Shazam,SoundHound等)的質量/性能,但它還取決於您希望進行何種識別(音頻文件指紋識別/標記,實時識別,OTA(空中下載)識別等)
打開Surce
AcoustID/MusicBrainz提供的工具來執行音頻指紋和元數據協會(指紋識別器和服務器)。您可以放置您自己的指紋/元數據服務器或使用MusicBrainz的服務。音頻文件指紋和識別的良好解決方案,不適用於實時高性能應用程序(即OTA)。我們還測試了音頻流監控(廣播監控),但結果很差。
Echoprint提供了相同的工具AcoustID(指紋識別器和服務器+元),也可以用於音頻流的監控,因爲它可以體面的準確性音頻中承認從任何地方採取的片段(但我不會用它對於嚴重的商業應用)。他們還聲稱它適用於OTA應用程序,但性能無處適合生產用途。
Last.fm儘管他們已經開源了fingerprinting模塊,但並不完全開源。您必須查詢他們的標識和元數據提供商服務,因爲它們不提供完整的解決方案。
如果你正在尋找JAVA庫,那麼去MusicG,我已經用它在我過去的項目之一,它的工作正常。 http://code.google.com/p/musicg/
如果您在.NET中查找解決方案,請檢查SoundFingerprinting庫。
它是開源的,建立在使用Wavelets的內容指紋研究論文之上。
該算法與Shazaam不同,但總體思路相似:從光譜中提取最顯着的係數,然後使用它們構建指紋以供稍後檢索。
該算法的說明可以找到here。
你知道我們如何使用SQL服務器作爲永久存儲? – MonsterMMORPG 2017-01-30 19:02:21
對於語音識別:https://en.wikipedia.org/wiki/List_of_speech_recognition_software – user 2016-01-02 08:40:24
echoprint url中斷 – 2017-10-31 09:01:48
網址已更新。謝謝@SarveshMishra – teriiehina 2017-11-02 19:06:08