問候研究員,如何直接讀取HTK中的後部probs?
我拼命試圖找到哪些文件,我將在HTK 3.4修改,這樣我就可以直接讀取音素/單音後probs的序列話語,並直接將其轉發給解碼器,給定了聲學和語言模型。
更詳細的,我正在關注包括第9步的HTK教程,我只是想在單聲道上工作。我的(自己的,特定的)特徵向量是具有每個音素的3個狀態的概率的向量序列,這類似於
(p(aa_begin),p(aa_mid),p(aa_end),...,p (z_begin),p(z_mid),p(z_end))
對於話語中的每個幀,其中條目如上所述,已經是後驗概率。
任何想法我需要修改哪些文件來讀取我(特定)文件(自己的二進制格式)的文件以及如何直接將它們轉發給解碼器?最好讓我可以使用HVite & HEResult獲得結果?
非常感謝幫助, G.
修改HTK以使用後代而不是GMM可能性將會變得複雜。您可以在HVite.c的ProcessFile函數中或HRec.c中的ProcessObservation函數中執行此操作。這聽起來像你想要的與Hybrid-HMM系統非常相似;使用谷歌搜索可能會有所幫助。另一種選擇是使用後人作爲特徵向量 - 這是在串聯繫統中完成的。這可能不是你想要的,但可能會更簡單。 – user1955591 2013-02-28 12:59:53
問候並感謝您的回覆。 posterios的向量我基本上是當前分類框架的特徵向量,所以你的觀察比較精確。在解碼時,HVite似乎是一個很好的選擇。我最害怕的是,我也必須修改FST ... – gilgamash 2013-03-01 08:54:46
嗨,你會從哪裏開始將後輩視爲一個功能?謝謝,G. – gilgamash 2013-03-01 09:59:31