2016-12-07 35 views

回答

0

功能非常相似。造成差異的是係數的數量,窗口大小,歸一化等等。看看this thread

使用mfcc功能,您可以通過多種方式區分揚聲器。最有名的技術有兩個是:

  • GMM/UBM技術:在您創建一個GMM各揚聲器和另一GMM作爲背景模型,那麼你的分數輸入話語。
  • i矢量技術:這是一種mfcc上的後處理,用於生成表示揚聲器聲學模型的新矢量。該技術用於Microsoft Speaker Recognition Servicehere's a description中。