2010-07-05 61 views
6

我有一個音頻流,我會從中提取單詞(語音)。因此,例如有audio.wav我會得到001.wav,002.wav,003.wav等,其中每個XXX.wav是一個字。用於從音頻流中提取單詞(語音)的庫?

我正在尋找一個庫或程序來做到這一點 - 平臺並不重要,但我更喜歡開源解決方案。

非常感謝您的幫助。

回答

2

Nuance,製造Dragon Naturally Speaking的公司的號碼爲Software Development Kits

Audio Mining套件似乎滿足您的要求:

龍NaturallySpeaking SDK AudioMining是一個獨立揚聲器 語音識別工具包, 允許的音頻文件中的 語音信息100%的索引。 該技術使用高度準確的 語音識別將音頻文件 轉換爲帶有時間戳 信息的XML文本。這可以集成 與標準文本搜索產品 使內容能夠快速訪問特定音頻 內容。

語音到語音+元數據是遙遙領先的難題。一旦你有語音+元數據,提取單詞作爲單獨的音頻文件是much more straightforward

+0

NB提到的音頻挖掘工具包帶有以下警告:「** Dragon AudioMining技術專爲美國英語設計,不適用於會議錄音或採訪。**」 – LeeGee 2013-09-20 13:02:04

+0

@greenoldman首選開源解決方案 – 2014-12-02 20:47:36

+0

在Nuance AudioMining上在線查找信息非常困難。而且這似乎是相互矛盾的,因爲在1999年的產品發佈會上明確提到了會議和採訪的轉錄:https://www.youtube.com/watch?v = yagvFY_rUwM – Christoph 2015-10-22 16:39:05