2013-02-19 89 views
0

在提出問題時,應該將整個問題分解成更小的問題並逐個解決問題。 但我在問這個問題,以便完全解釋我的需求和技術侷限性,希望有人提出一套完美的技術。實時3D模型渲染和實時文本到語音

我設計的東西,將接受文本輸入轉換成講話 這個講話是由3D模型嘟囔在實時

在這裏你可以看到所有這些東西應該是實時的,因此只有我在想一些遊戲引擎, 這樣做的,但我不知道是什麼,我在這裏做的是可能的。

我需要指導,一個道路,我應該如何開始。

+0

Google是你的朋友。一次開始一部分。 – 2013-02-19 06:17:00

+0

感謝大衛,經過幾個小時的谷歌搜索,我意識到我可能只是重新發明輪子,我沒有在圖形領域的經驗,但我相信一些遊戲引擎必須已經回答了這個問題。 – pushgr8 2013-02-19 06:26:45

+0

VTK可能會幫助你解決技術問題。 http://www.vtk.org/ – 2013-02-19 06:27:08

回答

0

您還沒有指定一個平臺,即Windows/Linux等,雖然它可能並不重要。

我最初的想法是將PICO tts庫與Blender Game Engine(BGE)結合在一起。 雖然我不確定是否有Pico引擎的Python綁定。

espeak項目(espeak.sourceforge.net/)將正常文本轉換爲音素,然後可以用它來驅動形狀鍵(或混合鍵,我忘了Blender的名字,已經有5年多了我上次玩過Blender/Maya/3DSMax)。

大概,你可以在python中實現espeak引擎(或者創建一個可以通過python訪問的模塊),然後在將它們傳遞給你的shape/blend-key控制器並同時傳遞給Pico之前生成所需的音素。

快速瀏覽之後,似乎libttspico-dev是支持啓用pico的應用程序開發的軟件包,但它似乎只包含c/C++文件 - 我想應該可以創建一個利用槓桿的python模塊引擎,但我對Pico的任何更多的瞭解都不是很熟悉,而不是它的名字和基本功能。這可能是一個愚蠢的和不知情的建議。

無論如何,這肯定是一個有趣的項目。也許更簡單的方法是用C/C++創建一個使用OGRE和Pico的應用程序。重要的因素是OGRE從一個形狀鍵到下一個鍵的混合能力 - 也可能是Pico在內部執行所有操作,以至於無法在播放語音中獲得回調或監視其當前位置。

已收藏。

+0

非常感謝您幫助流浪者。 雖然線程已關閉,但您向我展示了繼續的方式,而非啓動。 我忘了提及在Linux上的要求。 如果我們不能從Pico獲得回調,那麼C/C++中的應用程序可以設計爲向pico發送受控輸入以獲得期望的結果。 再次感謝你! – pushgr8 2013-02-19 16:37:14

+0

非常歡迎。很高興知道我已經幫助提供了一些方向和調查途徑。幾年前看到一個閃光指南,它將文字轉換爲音素並基於它製作動畫角色,但實時處理3d模型與實際演講相結合的想法讓我想起了雷鳥和他們的超級領域(en.wikipedia .org/wiki/Supermarionation)似乎太有趣了,無法抵制尋求解決問題的途徑的衝動。祝你好運和最好的問候。 :) – enhzflep 2013-02-19 16:47:08