2012-11-27 32 views
0

我想用Sphinx做語音識別。從Ekiga軟件電話/ Pulseaudio JACK水槽捕獲傳入音頻

我正在尋找使用Java或Python捕捉Ekiga VOIP軟電話的輸出/輸入音頻,並將其傳遞給Sphinx。現在,輸出指向PulseAudio JACK Sink。

對不起,如果我不使用正確的術語,因爲我在這是一個很小菜。

如果你能指出我正確的方向,將非常感謝,謝謝。

回答

0

您需要正確地形成要存檔的任務併爲此選擇合適的工具。軟件開發人員不使用Ekiga等桌面應用程序來完成他們的項目。只是因爲桌面應用程序是爲用戶編寫的,它們不適用於軟件開發人員。您只能修改源代碼中的Ekiga等桌面應用程序,但這是完全不同的故事。

如果你想擁有一個VOIP端點並將其連接到一個語音識別服務,你需要看看IVR系統和類似的東西。 IVR系統是通過VOIP協議實現複雜交互的特定工具。一些例子是:

Freeswitch

Asterisk

GNU Gatekeeper - 一個項目是建立在相同的歐泊技術作爲的Ekiga

您可以設置FreeSWITCH的等待調用並將其傳遞給pcoketsphinx 。你可以用Asterisk做同樣的事情。欲瞭解更多詳情,請參見

How to use Pocketpshinx from Freeswitch

How to integrate Pocketsphinx in Asterisk using UniMRCP project

+0

謝謝你的指導... 我應該擔心分離傳入和傳出的聲音或獅身人面像強大到足以使區別? –

+0

在VOIP頻道默認情況下分開處理,你不需要關心分離。 CMUSphinx不支持在單個通道上分離聲音的功能,還有其他工具。 –

+0

謝謝。我查看了Asterisk AGI,我想我現在已經有足夠的空間了。 –