mfcc特征提取技术 mfcc特征参数提取后怎么实现语音识别?
mfcc特征参数提取后怎么实现语音识别?
1. 使用audioread(”)函数读取计算机音频文件参数audio file path:[sampledata,FS]=audioread(”F:1。MP3”)sampledata保存音频信号数据FS audio rate MP3格式rate 44100;2。判断音频数据是否为双通道双通道,保留音频通道数据,使用calsample。M file函数完成函数文件内容:function sample=calsample(sampledata,FS)tempusample=resample(sampledata,1,FS/11025)[M,n]=size(tempusample)if(n==2)sample=tempusample(:,1)elsesample=tempumfcc:Mel频率倒谱系数的缩写。Mel频率是根据人的听觉特性提出的,它与Hz频率呈非线性关系。Mel倒谱系数(MFCC)是利用它们之间的关系计算出的频谱特性。MFCC参数提取包括以下步骤:预滤波:抗混叠滤波,采用300-3400hz前端带宽的编解码器。A/D转换:8kHz采样频率,12位线性量化精度。预强调:通过一阶有限激励响应高通滤波器,信号频谱变得平坦,不易受到有限字长效应的影响。分帧:根据语音的短时平稳特性,可以对语音进行分帧处理。实验中选取的语音帧长为32ms,帧堆栈为16ms,加窗:采用汉明窗对一帧进行加窗,以减少Gibbs效应的影响。快速傅立叶变换(FFT):将时域信号转换成信号的功率谱。
什么是mfcc特征及其提取过程?
频谱的对数是倒谱。你可以把声音的频谱想象成包络和共振峰的乘积。日志之后,可以将这两个术语分开。此时,您可以制作IFFT来封装信息。由于振幅变化不大,它将集中在倒谱的低频端,而共振变化将集中在倒谱的高频端。简而言之,目的是分离我我们需要的信封和共振峰信息。
mfcc特征提取技术 python mfcc特征提取 特征提取定义
版权声明:本文内容由互联网用户自发贡献,本站不承担相关法律责任.如有侵权/违法内容,本站将立刻删除。