htk

0熱度

2回答

大家好日子，我是新來的語音識別。現在，我正在與HTK一起處理語音識別。我有55％的準確性結果。我想問一下：我可以集成HTK的結果，使它從實時識別器？我應該怎麼處理才能做出實時識別器？任何幫助將不勝感激。謝謝。

1熱度

1回答

我有一個系統，用戶被要求在提示後重復一個句子。它使用HTK到force-align這個用戶口語句子來定義預定義的字級標籤文件（句子）來得到一個時間對齊的電話級文件。 HMM已經接受了大量數據的培訓，並提供了與HVite非常準確的時間對齊文件。我的問題出現時，用戶不說出需要說出的確切句子。讓我用一個例子：這是一個非常GOOD DAY：需要說出目標句子（已知用戶）的字級標籤文件。用戶說（案例1）

1熱度

2回答

如何解決HTK ERROR中的錯誤[+2662] FindProtoModel：hSet中沒有原型

我在更改語法並添加了幾個新句子後運行julius，並在步驟10中得到此錯誤。 AU fulllist Creating HMMset using trees to add unseen triphones ERROR [+2662] FindProtoModel: no proto for ei in hSet FATAL ERROR - Terminating program C:

0熱度

2回答

錯誤[+2640] TreeBuildCommand：TB命令必須按順序排列

我在voxforge julius教程中提供的示例教程中添加了一些單詞，如水果名稱。我認爲語法和voca文件是正確的，並且在最後這個錯誤中我被困在最後一步。我檢查了我的monophones0文件，我沒有做任何更改，我只是複製它，因爲它是在教程中使用perl命令創建樹。我不知道爲什麼我現在有這個錯誤。 TB 350.00 ST_a_2_ {} 樹基於聚類錯誤[2640] TreeBuildCom

0熱度

2回答

bash找不到HTK命令

我現在使用HTK的時間已經很長一段時間了，它用來完美地工作。遲到（可能在此期間改變了一些環境變量，但不記得哪些變量！），所有的HTK命令都是「不可找到的」。執行HCompV例如給予了慶典：在/ usr/local/bin目錄/ HCompV：沒有這樣的文件或目錄即使HCompV是在/ usr/local/bin目錄可見。重新編譯和安裝HTK是徒勞的。從編譯後的HTK的bin文件夾中運行HC

0熱度

1回答

使用HTK修改揚聲器

我正嘗試將基於單音素的識別器改編爲特定發言者。我正在使用HTKBook 3.4.1 section 3.6.2中給出的配方。我被陷在HHEd一部分，我調用像SP： HHEd -A -D -T 1 -H hmm15/hmmdefs -H hmm15/macros -M classes regtree.hed monophones1eng 我最終的錯誤如下： ERROR [+999] Componen

1熱度

1回答

使用ffmpeg解碼的過程音頻數據包

繼我的其他post之後，我對wondernig是否有可能在解碼音頻數據包上執行一些類似MFCC提取的過程進行了說明。我使用ffmpeg從mpeg-2文件中解碼音頻和視頻的代碼。視頻處理是使用opencv完成的，因爲該庫允許通過一個幀來抓取幀。我需要在同一時間處理相應的音頻樣本。謝謝。

0熱度

1回答

使用htk進行非數字識別

我一直在嘗試將HTk與sphinx4配合使用來進行語音識別應用。我以wav文件的形式提供我的輸入，並且我使用提供了「Transcriber demo」和「Lattice Demo」的獅身人面像，但是輸出幾乎不可接受。所以我決定用Sphinx4引入HTK。但由此產生的輸出似乎數英里之遙。我相信配置可以進一步調整..比我在做什麼。我已經很好地查找了是否有與使用htk和sphinx4相關的ny教程。除了

0熱度

1回答

獨立處理音頻和視頻

由於我最後的帖子不受歡迎here和here，我會嘗試別的。我有相應的音頻（.wav）和視頻文件（.mpg）。讓我們考慮那些同步記錄的兩個流。我想同時處理流和圖像的opencv，以及「我不知道哪個音頻庫」（你告訴我？）音頻，我想在線處理這些流並保持同步。請注意，視頻的長度少於2分鐘。感謝您的幫助！

0熱度

1回答

在sphinx-4上使用HTK聲學模型

我一直在使用sphinx-4作爲語音識別工具，我仍然在試着學習這個工具。我有一個使用HTK開發的阿拉伯語聲學模型。我想知道如何在Sphinx-4中使用這種聲學模型。