2011-06-07 38 views

回答

16
  • echoprint看起來像一個堅實的替代商業庫。

語音識別:

我們只測試echoprint和到目前爲止好。

我知道答案是有點晚了,但因爲這個頁面在谷歌彈出,大家不妨提高它隨着時間的推移:)

編輯爲CMU的語音導向

+0

對於語音識別:https://en.wikipedia.org/wiki/List_of_speech_recognition_software – user 2016-01-02 08:40:24

+0

echoprint url中斷 – 2017-10-31 09:01:48

+0

網址已更新。謝謝@SarveshMishra – teriiehina 2017-11-02 19:06:08

8

有幾個開放盡管您可能會忘記商業音頻識別服務(如Shazam,SoundHound等)的質量/性能,但它還取決於您希望進行何種識別(音頻文件指紋識別/標記,實時識別,OTA(空中下載)識別等)

打開Surce

  • AcoustID/MusicBrainz提供的工具來執行音頻指紋和元數據協會(指紋識別器和服務器)。您可以放置​​您自己的指紋/元數據服務器或使用MusicBrainz的服務。音頻文件指紋和識別的良好解決方案,不適用於實時高性能應用程序(即OTA)。我們還測試了音頻流監控(廣播監控),但結果很差。

  • Echoprint提供了相同的工具AcoustID(指紋識別器和服務器+元),也可以用於音頻流的監控,因爲它可以體面的準確性音頻中承認從任何地方採取的片段(但我不會用它對於嚴重的商業應用)。他們還聲稱它適用於OTA應用程序,但性能無處適合生產用途。

  • Last.fm儘管他們已經開源了fingerprinting模塊,但並不完全開源。您必須查詢他們的標識和元數據提供商服務,因爲它們不提供完整的解決方案。

1

如果您在.NET中查找解決方案,請檢查SoundFingerprinting庫。

它是開源的,建立在使用Wavelets的內容指紋研究論文之上。

該算法與Shazaam不同,但總體思路相似:從光譜中提取最顯着的係數,然後使用它們構建指紋以供稍後檢索。

該算法的說明可以找到here

+0

你知道我們如何使用SQL服務器作爲永久存儲? – MonsterMMORPG 2017-01-30 19:02:21