2013-03-29 19 views
4

我對shazam或soundhound如何工作感興趣。Shazam/soundhound如何工作?

它如何記錄語音並使指紋與指紋數據庫相似?

我即將開始在C/C++中編寫一些軟件,但不確定要使用哪個庫,看到有一些來自Microsoft的Speech SDK。你有沒有建議,從哪裏開始'理解'分析語音和玩它的過程?

我會很感謝每一個提示或想法,你會分享:]

+0

我也有興趣在這些算法中,雖然你將決定,是否想知道,該算法是什麼,或者庫使用。這是兩個不同的問題,第二個問題有資格解決這個問題,我認爲(答案是「適合你需求的問題」)。 – Spook

+0

我認爲c和C++不是這個問題的正確標籤。 – Etherealone

+0

非常贊同C/C++。我想知道是否有人在譜圖,聲學指紋等方面有一些知識,並可以在幾句話中解釋哪條路要走:] –

回答

3

有一些現有的軟件作品,你可以看看:

AudioDB:C++

善變回購: http://code.soundsoftware.ac.uk/projects/audiodb/

Sonic Visualiser:SV庫是用C++編寫的使用Qt4

https://code.soundsoftware.ac.uk/projects/sonic-visualiser

+0

謝謝!我會看看它。 –

+0

也有很多其他的項目,例如** CAMEL **(基於內容的音頻和音樂提取庫)是一款易於使用的C++框架,專爲基於內容的音頻和音樂分析而開發。該框架提供了一組易於分割,特徵提取,域提取等工具。 – hyponym