GMM-UBM

高斯混合模型和通用背景模型

一 GMM-UBM(MAP-GMM)说话人所识别系统

1 UBM(Universal Background Model)

UBM其实就是一个大型的GMM模型,用来训练表示与说话人无关的特征分布。它的训练数据是某一信道下的所有人的语音数据,而不是想target模型只是反映某一个人的特征分布。说白了,只是一个大的GMM,那么训练UBM也就是训练GMM,所用算法采用的是EM算法。 GMM中,从说话人语音抽出来的D维特征矢量对应的似然率可用K 个高斯分量表示:

GMM-UBM

其中是第K个高斯分量的权重,

GMM-UBM

所以,整个高斯模型可以用模型参数 i=1,2...m来表示。

2 参数调整算法 EM算法

现在的问题是如何根据已知的T个特征矢量(t=1,2,3..T)来确定GMM参数。按照极大似然估计,参数应该使这T个的平均概率最大,也就是使对数似然函数L最大。

GMM-UBM

GMM参数的估计基于最大似然准则ML,通过EM迭代算法来实现,这时可以得到GMM模型中权重,均值,方差的迭代公式:

相关推荐
相关主题
热门推荐