1
我有一個概念問題。用於說話人識別和語音識別的MFCC功能之間的區別?
我知道什麼是MFCC。但是我無法找到用於說話者識別和語音識別的mfcc特徵向量之間的區別,即哪個部分的mfcc特徵被用作兩個之間的區分因子? 而且我們如何在mfcc矢量的基礎上區分兩個揚聲器?
我有一個概念問題。用於說話人識別和語音識別的MFCC功能之間的區別?
我知道什麼是MFCC。但是我無法找到用於說話者識別和語音識別的mfcc特徵向量之間的區別,即哪個部分的mfcc特徵被用作兩個之間的區分因子? 而且我們如何在mfcc矢量的基礎上區分兩個揚聲器?
功能非常相似。造成差異的是係數的數量,窗口大小,歸一化等等。看看this thread。
使用mfcc功能,您可以通過多種方式區分揚聲器。最有名的技術有兩個是: