我想創建具有節點js的web應用程序並對js進行響應。如何存儲語音並從數據庫中識別?
這個網頁應用程序將會有2個頁面,其中一個將記錄語音並存儲在數據庫中,而在第二頁面中,任何用戶可以在該web應用程序匹配該語音和數據庫之後進入並說出任何內容,用用戶名返回。
我已經做了記錄的一部分保存在文件夾,但不知道是哪個數據庫,我應該用它來存儲數據,可以匹配第二頁中的數據時,用戶不需要有名字的時候他們說提前東西..
感謝我新的節點,併發生反應,請這方面的幫助:d
我想創建具有節點js的web應用程序並對js進行響應。如何存儲語音並從數據庫中識別?
這個網頁應用程序將會有2個頁面,其中一個將記錄語音並存儲在數據庫中,而在第二頁面中,任何用戶可以在該web應用程序匹配該語音和數據庫之後進入並說出任何內容,用用戶名返回。
我已經做了記錄的一部分保存在文件夾,但不知道是哪個數據庫,我應該用它來存儲數據,可以匹配第二頁中的數據時,用戶不需要有名字的時候他們說提前東西..
感謝我新的節點,併發生反應,請這方面的幫助:d
可以使用https://firebase.google.com/谷歌的火力爲您實時數據庫或用於存儲音頻文件
但匹配兩個語音將無法正常工作爲你必須使用一些像圖書館https://www.npmjs.com/package/wav-file-info
將語音輸入與音頻是在數據庫
你正在試圖解決的問題是自動語音識別(ASR)的一部分進行比較。很明顯,您無法比較此問題域中的兩個音頻文件。相反,您需要計算語音的某種特徵/指紋並匹配這些特徵。 Mel-Frequency Cepstral Coefficients(MFCC)(click here)是一種常見的特徵提取算法。對於python,我知道一個名爲python_speech_features的庫。該庫可以提取MFCC功能。爲了匹配功能,您可以使用機器學習算法。
保存在數據庫中:http://stackoverflow.com/questions/154707/what-is-the-best-way-to-store-media-files-on-a-database – AddcitedToLearn