htk

    0熱度

    2回答

    大家好日子, 我是新來的語音識別。 現在,我正在與HTK一起處理語音識別。 我有55%的準確性結果。 我想問一下: 我可以集成HTK的結果,使它從實時識別器? 我應該怎麼處理才能做出實時識別器? 任何幫助將不勝感激。謝謝。

    1熱度

    1回答

    我有一個系統,用戶被要求在提示後重復一個句子。它使用HTK到force-align這個用戶口語句子來定義預定義的字級標籤文件(句子)來得到一個時間對齊的電話級文件。 HMM已經接受了大量數據的培訓,並提供了與HVite非常準確的時間對齊文件。我的問題出現時,用戶不說出需要說出的確切句子。讓我用一個例子: 這是一個非常GOOD DAY:需要說出目標句子(已知用戶)的 字級標籤文件。 用戶說(案例1)

    1熱度

    2回答

    我在更改語法並添加了幾個新句子後運行julius,並在步驟10中得到此錯誤。 AU fulllist Creating HMMset using trees to add unseen triphones ERROR [+2662] FindProtoModel: no proto for ei in hSet FATAL ERROR - Terminating program C:

    0熱度

    2回答

    我在voxforge julius教程中提供的示例教程中添加了一些單詞,如水果名稱。我認爲語法和voca文件是正確的,並且在最後這個錯誤中我被困在最後一步。 我檢查了我的monophones0文件,我沒有做任何更改,我只是複製它,因爲它是在教程中使用perl命令創建樹。我不知道爲什麼我現在有這個錯誤。 TB 350.00 ST_a_2_ {} 樹基於聚類 錯誤[2640] TreeBuildCom

    0熱度

    2回答

    我現在使用HTK的時間已經很長一段時間了,它用來完美地工作。遲到(可能在此期間改變了一些環境變量,但不記得哪些變量!),所有的HTK命令都是「不可找到的」。執行HCompV例如給予了 慶典:在/ usr/local/bin目錄/ HCompV:沒有這樣的文件或目錄 即使HCompV是在/ usr/local/bin目錄可見。 重新編譯和安裝HTK是徒勞的。 從編譯後的HTK的bin文件夾中運行HC

    0熱度

    1回答

    我正嘗試將基於單音素的識別器改編爲特定發言者。我正在使用HTKBook 3.4.1 section 3.6.2中給出的配方。我被陷在HHEd一部分,我調用像SP: HHEd -A -D -T 1 -H hmm15/hmmdefs -H hmm15/macros -M classes regtree.hed monophones1eng 我最終的錯誤如下: ERROR [+999] Componen

    1熱度

    1回答

    繼我的其他post之後,我對wondernig是否有可能在解碼音頻數據包上執行一些類似MFCC提取的過程進行了說明。我使用ffmpeg從mpeg-2文件中解碼音頻和視頻的代碼。視頻處理是使用opencv完成的,因爲該庫允許通過一個幀來抓取幀。我需要在同一時間處理相應的音頻樣本。 謝謝。

    0熱度

    1回答

    我一直在嘗試將HTk與sphinx4配合使用來進行語音識別應用。我以wav文件的形式提供我的輸入,並且我使用提供了「Transcriber demo」和「Lattice Demo」的獅身人面像,但是輸出幾乎不可接受。所以我決定用Sphinx4引入HTK。但由此產生的輸出似乎數英里之遙。我相信配置可以進一步調整..比我在做什麼。我已經很好地查找了是否有與使用htk和sphinx4相關的ny教程。除了

    0熱度

    1回答

    由於我最後的帖子不受歡迎here和here,我會嘗試別的。 我有相應的音頻(.wav)和視頻文件(.mpg)。讓我們考慮那些同步記錄的兩個流。我想同時處理流和圖像的opencv,以及「我不知道哪個音頻庫」(你告訴我?)音頻,我想在線處理這些流並保持同步。 請注意,視頻的長度少於2分鐘。 感謝您的幫助!

    0熱度

    1回答

    我一直在使用sphinx-4作爲語音識別工具,我仍然在試着學習這個工具。 我有一個使用HTK開發的阿拉伯語聲學模型。我想知道如何在Sphinx-4中使用這種聲學模型。