用於說話人識別和語音識別的MFCC功能之間的區別？

我知道什麼是MFCC。但是我無法找到用於說話者識別和語音識別的mfcc特徵向量之間的區別，即哪個部分的mfcc特徵被用作兩個之間的區分因子？而且我們如何在mfcc矢量的基礎上區分兩個揚聲器？

2016-12-07 Nikhil

功能非常相似。造成差異的是係數的數量，窗口大小，歸一化等等。看看this thread。

使用mfcc功能，您可以通過多種方式區分揚聲器。最有名的技術有兩個是：

GMM/UBM技術：在您創建一個GMM各揚聲器和另一GMM作爲背景模型，那麼你的分數輸入話語。
i矢量技術：這是一種mfcc上的後處理，用於生成表示揚聲器聲學模型的新矢量。該技術用於Microsoft Speaker Recognition Service和here's a description中。

2017-01-12 11:10:04

回答