如何存儲語音並從數據庫中識別？

我想創建具有節點js的web應用程序並對js進行響應。如何存儲語音並從數據庫中識別？

這個網頁應用程序將會有2個頁面，其中一個將記錄語音並存儲在數據庫中，而在第二頁面中，任何用戶可以在該web應用程序匹配該語音和數據庫之後進入並說出任何內容，用用戶名返回。

我已經做了記錄的一部分保存在文件夾，但不知道是哪個數據庫，我應該用它來存儲數據，可以匹配第二頁中的數據時，用戶不需要有名字的時候他們說提前東西..

感謝我新的節點，併發生反應，請這方面的幫助：d

2017-04-26 Mohit Jain

保存在數據庫中：http://stackoverflow.com/questions/154707/what-is-the-best-way-to-store-media-files-on-a-database – AddcitedToLearn

可以使用https://firebase.google.com/谷歌的火力爲您實時數據庫或用於存儲音頻文件

但匹配兩個語音將無法正常工作爲你必須使用一些像圖書館https://www.npmjs.com/package/wav-file-info

將語音輸入與音頻是在數據庫

來源

2017-08-05 21:05:12

你正在試圖解決的問題是自動語音識別（ASR）的一部分進行比較。很明顯，您無法比較此問題域中的兩個音頻文件。相反，您需要計算語音的某種特徵/指紋並匹配這些特徵。 Mel-Frequency Cepstral Coefficients（MFCC）（click here）是一種常見的特徵提取算法。對於python，我知道一個名爲python_speech_features的庫。該庫可以提取MFCC功能。爲了匹配功能，您可以使用機器學習算法。

來源

2017-10-11 06:24:45

如何存儲語音並從數據庫中識別？

回答

相關問題