在提出問題時,應該將整個問題分解成更小的問題並逐個解決問題。 但我在問這個問題,以便完全解釋我的需求和技術侷限性,希望有人提出一套完美的技術。實時3D模型渲染和實時文本到語音
我設計的東西,將接受文本輸入轉換成講話 這個講話是由3D模型嘟囔在實時。
在這裏你可以看到所有這些東西應該是實時的,因此只有我在想一些遊戲引擎, 這樣做的,但我不知道是什麼,我在這裏做的是可能的。
我需要指導,一個道路,我應該如何開始。
在提出問題時,應該將整個問題分解成更小的問題並逐個解決問題。 但我在問這個問題,以便完全解釋我的需求和技術侷限性,希望有人提出一套完美的技術。實時3D模型渲染和實時文本到語音
我設計的東西,將接受文本輸入轉換成講話 這個講話是由3D模型嘟囔在實時。
在這裏你可以看到所有這些東西應該是實時的,因此只有我在想一些遊戲引擎, 這樣做的,但我不知道是什麼,我在這裏做的是可能的。
我需要指導,一個道路,我應該如何開始。
您還沒有指定一個平臺,即Windows/Linux等,雖然它可能並不重要。
我最初的想法是將PICO tts庫與Blender Game Engine(BGE)結合在一起。 雖然我不確定是否有Pico引擎的Python綁定。
espeak項目(espeak.sourceforge.net/)將正常文本轉換爲音素,然後可以用它來驅動形狀鍵(或混合鍵,我忘了Blender的名字,已經有5年多了我上次玩過Blender/Maya/3DSMax)。
大概,你可以在python中實現espeak引擎(或者創建一個可以通過python訪問的模塊),然後在將它們傳遞給你的shape/blend-key控制器並同時傳遞給Pico之前生成所需的音素。
快速瀏覽之後,似乎libttspico-dev是支持啓用pico的應用程序開發的軟件包,但它似乎只包含c/C++文件 - 我想應該可以創建一個利用槓桿的python模塊引擎,但我對Pico的任何更多的瞭解都不是很熟悉,而不是它的名字和基本功能。這可能是一個愚蠢的和不知情的建議。
無論如何,這肯定是一個有趣的項目。也許更簡單的方法是用C/C++創建一個使用OGRE和Pico的應用程序。重要的因素是OGRE從一個形狀鍵到下一個鍵的混合能力 - 也可能是Pico在內部執行所有操作,以至於無法在播放語音中獲得回調或監視其當前位置。
已收藏。
非常感謝您幫助流浪者。 雖然線程已關閉,但您向我展示了繼續的方式,而非啓動。 我忘了提及在Linux上的要求。 如果我們不能從Pico獲得回調,那麼C/C++中的應用程序可以設計爲向pico發送受控輸入以獲得期望的結果。 再次感謝你! – pushgr8 2013-02-19 16:37:14
非常歡迎。很高興知道我已經幫助提供了一些方向和調查途徑。幾年前看到一個閃光指南,它將文字轉換爲音素並基於它製作動畫角色,但實時處理3d模型與實際演講相結合的想法讓我想起了雷鳥和他們的超級領域(en.wikipedia .org/wiki/Supermarionation)似乎太有趣了,無法抵制尋求解決問題的途徑的衝動。祝你好運和最好的問候。 :) – enhzflep 2013-02-19 16:47:08
Google是你的朋友。一次開始一部分。 – 2013-02-19 06:17:00
感謝大衛,經過幾個小時的谷歌搜索,我意識到我可能只是重新發明輪子,我沒有在圖形領域的經驗,但我相信一些遊戲引擎必須已經回答了這個問題。 – pushgr8 2013-02-19 06:26:45
VTK可能會幫助你解決技術問題。 http://www.vtk.org/ – 2013-02-19 06:27:08