phoneme

    -2熱度

    1回答

    專家系統如何將傳入的聲音音素與已存儲在知識庫中的其他聲音音素進行匹配?

    2熱度

    1回答

    我正在嘗試通過Phoneme單詞翻譯實現英文單詞以創建CMUSphinx的語言模型。現在,我使用下面的工具來達到這個詞翻譯link 例如,如果我給一個文本文件,用如下文字輸入,將得到翻譯如下 NAMASTE N AH M EY S T 但我想這樣做動態使用Java。是否有任何API或圖書館來實現這一目標。我不想重新發明輪子。還有其他一些編程語言,我可以使用庫。

    0熱度

    1回答

    我想對列表應用一個操作,該列表一次應該包含三個元素。 元素是串,它由隨後的數字字符,如 '234.23432 hel' 因此,一個樣本串想這樣 ['0.234 sil', '0.433 dh', '0.822 ax', '1.122 t', '1.45 r', '1.890 ih', '2.302 p'] end_point = 2.56 在每個串的數量的起始時間(下一個元素的開始時間標

    1熱度

    1回答

    我正在使用Visual Basic.net Ultimate,並且正在開發TTS應用程序。請給我一些關於音素元素的幫助。 這裏是我要發言全文: 當你釋放你的肩部和頸部的緊張局勢,採取另一種深呼吸......進出。 目前,這兩個詞「氣息」似乎是一起運行,聽起來像「呼吸瘦」 我想(通過SSML)修改此聲明,這樣的話聽起來像「在呼吸。」 什麼是最好的方式來通過SSML做到這一點?我在想,音素元素是做到這

    0熱度

    2回答

    是否可以在pocketsphinx的幫助下提取說出的單詞的音素?

    8熱度

    2回答

    我正在使用卡內基梅隆大學發音字典檢測Python中的韻,並且想知道:我如何估計兩個詞之間的音素相似度?換句話說,是否有一種算法能夠識別「手」和「計劃」比「手」和「薯條」更接近押韻的事實? 一些方面:首先,我願意說,兩個詞押韻,如果他們的主要重讀音節和所有後續音節是相同的(c06d,如果你想在Python中複製): def create_cmu_sound_dict(): final_s

    1熱度

    1回答

    我正在研究一個項目,我必須將Pocketsphinx的語音功能集成到android應用程序中。事實上,我必須整合由Pocketpshinx提供的音位識別功能,這些功能應該能夠識別法語的音素,例如, (如「de」,「re」,「se」等),輔音(如「m」,「f」,「g」等),雙輔音(如「 kl「,」ks「,」gr「等)和元音(如」a「,」o「,」e「等)。 現在,我已經集成了Pocketsphinx來

    2熱度

    1回答

    我正在編寫一個基於Annosoft控制檯程序(Link to the Annosoft Tool)的自動Lip同步工具。本程序使用SAPI 5.1。對我來說它在Win XP 32 Bit上效果很好。但是有沒有什麼辦法可以在Win7 64位系統下運行? P.S.控制檯程序是開源的,但我不太熟悉SAPI和音頻處理,因此重寫整個代碼對我來說不是一個真正的選擇。 編輯:恐怕我的口頭表達並沒有真正讓我的問題

    0熱度

    1回答

    我已經通過使用我的語言模型將我的語音解碼爲音素。我需要將語音分割成句子和單詞。我知道,ctm文件將有所幫助。任何人都可以告訴我如何爲特定語音實例生成ctm文件?

    1熱度

    1回答

    我正在考慮爲我的母語開發語音識別軟件,我正在考慮爲此使用CMUSphinx-4。有一個CMU字典文件,其中包含英文單詞,將原始單詞分割到其音素邊界。例如, ABANDONED => ['AH','B','AE','N','D','AH','N','D'] 我無法理解背後的邏輯,想要爲這個詞的對話開發一個算法。如果任何人都可以知道這種轉換的算法或這種分裂如何發生,請與我分享。