0

美好的一天。我目前正在使用我們當地的方言進行機器翻譯(語音 - (文本 - 文本) - 語言),我已經有了語音和文本語料庫。但是,在將語音錄製爲輸入並將其轉錄爲文本文件時,我面臨一個問題,因爲可用於語音識別的模塊並未覆蓋我們的方言,大多數情況下它只支持英語和其他主要語言。使用Python語音朗讀方法

有沒有人知道我可以修復它?我很榮幸接受你的寶貴建議,這對我的學習會有很大的幫助。謝謝!

+0

歡迎來到SO。你在考慮轉錄整個句子嗎?或選擇的話?你可以投入多少時間?任何有關信號處理和機器學習的經驗?您可以從一個最先進的神經網絡(或類似的網絡)開始,解決類似的問題並檢查其數據集上的性能。這是一個很大的課題,你可以做博士論文。 –

+0

@LukaszTracewski謝謝你的迴應。事實是,我在CS的第一名碩士學生中,並且正在開始爲我的論文早期工作。我還有1年的時間來分配這個。然而,我在這個問題上搜索了引用,只支持主要語言。你能否給我提供參考資料或鏈接,以便我可以從我自己的方言開始閱讀關於言語到文本的內容?這對我來說是一個很大的幫助。 – EvanTheGreat

+0

歡迎來到StackOverflow。請閱讀並遵守幫助文檔中的發佈準則。 [在主題](http://stackoverflow.com/help/on-topic)和[如何提問](http://stackoverflow.com/help/how-to-ask)適用於此處。 – Prune

回答

0

對於不尋常方言的文本到語音處理工作是一個很大的挑戰,因爲音頻模型經常不存在,必須從頭開始創建。一個好的開始是從http://voxforge.org的教程之一。在這個網站上,您不僅可以找到涉及大量音頻解碼器和模型生成器的教程,而且還是一個有用的論壇,在這個論壇中,英語以外的各種語言的學生已經找到與他們自己的方言問題有關的解決方案。

一個總體計劃可能如下:按照給出的例子建立一個簡單的英語模型,以熟悉所涉及的術語和概念以及過程。鑑於英語的必然成功,您可以通過爲您自己的方言建立模型,將您擁有的本地語料庫變爲優勢。這是一個合理的目標,之前已經做過很多次了。不過要注意的是,要在廣泛的詞彙表中獲得良好的認可,您需要一個非常全面的語料庫數據集。

+0

非常感謝@Colin的見解。我將開始閱讀網站的教程。希望這對我來說是一個好的開始。 – EvanTheGreat