2
我正在開發一個系統,我需要起始幀,結束幀和分割來自一個詞或一個句子中的每個音素分數。我一直在使用獅身人面像-3命令:sphinx3_align,得到以下結果(示例):Sphinx4音素分割
SFrm EFrm SegAScr Phone
0 21 -67327 SIL
22 37 -236740 AH SIL K b
38 41 -61028 K AH S i
42 56 -82368 S K EH i
57 67 -106366 EH S P i
68 86 -101908 P EH T i
87 106 -89226 T P SIL e
107 113 -82281 SIL
Total score: -827244
的問題是,我必須先運行此命令多次,這會消耗大量的內存我的服務器。我嘗試在控制文件中傳遞很多輸入,但這需要花費很多時間來處理,而且我的應用程序不能有很高的響應時間。
因此,爲了消耗更少的內存來維持響應時間,我試圖在Sphinx-4中實現相同的系統。這樣我就可以在對齊後立即給出結果,而不必在每次運行時卸載應用程序。
我的疑問是在Sphinx-4中是否可以得到上面的輸出(類似於sphinx3_align)?