2012-12-21 38 views
0

我的主要問題如下:給定一組refence語音文件(從一個語音短語提取的特徵列表)和查詢語音輸入我需要找到一個我的引用最MATHES。關鍵是不要搜索所有這些,而是​​儘可能地剪除。有人可以指點我一個有效的算法來解決這個問題或任何處理這些事情的開源代碼? 謝謝語音檢索

回答

0

我假設在參考文件中所說的文本是相同的一個查詢文件。執行此操作的常用方法是將每個參考文件與查詢文件進行比較。通常情況下,您可以使用Dynamic Time Warping算法 - 維基百科文章有幾個實現的鏈接,並且自己實現並不難。基本的想法是嘗試對齊這兩個文件,並選擇與查詢最匹配的參考。

我知道你說你不想比較每個例子。在那種情況下,我的第一個想法是對參考文件進行聚類。離線您可以將參考文件相互比較並將相似的文件組合在一起。當需要查詢時,您只需比較每個羣集中的一個示例。根據結果​​,然後比較最近的一個或多個羣集中的所有文件。

這只是一個想法,我敢肯定還有其他的。

+0

比較與所有其他文件的查詢是什麼,我想避免的。集羣可能看起來不錯,但如果引用是完全不同的分組,它們可能是不可能的。 – Ray

+0

接受你的答案,因爲最終我最終使用DTW的一些約束。理解和實施起來更簡單。 – Ray

1

一種常用和有效的方法是建立自己的參考聲音文件的索引作爲一個有限狀態轉換器。見文章「加權自動機的總指數化:適用於說出的話語檢索」的西里爾Allauzen,梅里爾·莫里和穆拉特Saraclar(HLT-NAACL 2004)http://acl-arc.comp.nus.edu.sg/archives/acl-arc-090501d4/data/pdf/anthology-PDF/W/W04/W04-2907.pdf

+0

感謝您的建議。由於我沒有語音處理背景,我最終使用了我能理解的東西。我很欣賞你的答案,因爲它是新的東西(我不熟悉)。在我的空閒時間試圖理解它。我瀏覽了它,發現它很有趣。再次感謝。 – Ray