Shazam/soundhound如何工作？

我對shazam或soundhound如何工作感興趣。Shazam/soundhound如何工作？

它如何記錄語音並使指紋與指紋數據庫相似？

我即將開始在C/C++中編寫一些軟件，但不確定要使用哪個庫，看到有一些來自Microsoft的Speech SDK。你有沒有建議，從哪裏開始'理解'分析語音和玩它的過程？

我會很感謝每一個提示或想法，你會分享：]

我也有興趣在這些算法中，雖然你將決定，是否想知道，該算法是什麼，或者庫使用。這是兩個不同的問題，第二個問題有資格解決這個問題，我認爲（答案是「適合你需求的問題」）。 – Spook

我認爲c和C++不是這個問題的正確標籤。 – Etherealone

非常贊同C/C++。我想知道是否有人在譜圖，聲學指紋等方面有一些知識，並可以在幾句話中解釋哪條路要走：] –

有一些現有的軟件作品，你可以看看：

AudioDB：C++

Sonic Visualiser：SV庫是用C++編寫的使用Qt4

2013-03-29 12:56:43 hyponym

謝謝！我會看看它。 –

也有很多其他的項目，例如** CAMEL **（基於內容的音頻和音樂提取庫）是一款易於使用的C++框架，專爲基於內容的音頻和音樂分析而開發。該框架提供了一組易於分割，特徵提取，域提取等工具。 – hyponym

回答