6
我有一個音頻流,我會從中提取單詞(語音)。因此,例如有audio.wav我會得到001.wav,002.wav,003.wav等,其中每個XXX.wav是一個字。用於從音頻流中提取單詞(語音)的庫?
我正在尋找一個庫或程序來做到這一點 - 平臺並不重要,但我更喜歡開源解決方案。
非常感謝您的幫助。
我有一個音頻流,我會從中提取單詞(語音)。因此,例如有audio.wav我會得到001.wav,002.wav,003.wav等,其中每個XXX.wav是一個字。用於從音頻流中提取單詞(語音)的庫?
我正在尋找一個庫或程序來做到這一點 - 平臺並不重要,但我更喜歡開源解決方案。
非常感謝您的幫助。
Nuance,製造Dragon Naturally Speaking的公司的號碼爲Software Development Kits。
的Audio Mining套件似乎滿足您的要求:
龍NaturallySpeaking SDK AudioMining是一個獨立揚聲器 語音識別工具包, 允許的音頻文件中的 語音信息100%的索引。 該技術使用高度準確的 語音識別將音頻文件 轉換爲帶有時間戳 信息的XML文本。這可以集成 與標準文本搜索產品 使內容能夠快速訪問特定音頻 內容。
語音到語音+元數據是遙遙領先的難題。一旦你有語音+元數據,提取單詞作爲單獨的音頻文件是much more straightforward。
NB提到的音頻挖掘工具包帶有以下警告:「** Dragon AudioMining技術專爲美國英語設計,不適用於會議錄音或採訪。**」 – LeeGee 2013-09-20 13:02:04
@greenoldman首選開源解決方案 – 2014-12-02 20:47:36
在Nuance AudioMining上在線查找信息非常困難。而且這似乎是相互矛盾的,因爲在1999年的產品發佈會上明確提到了會議和採訪的轉錄:https://www.youtube.com/watch?v = yagvFY_rUwM – Christoph 2015-10-22 16:39:05