共查询到20条相似文献,搜索用时 15 毫秒
1.
采用能够反映人对语音的感知特性的Mel频率倒谱系数(MFCC)作为语音的特征参数,研究了基于MFCC的VQ的识别方法,对单独使用MFCC与使用MFCC和AMFCC结合的识别率进行比较,实验结果表明通过对说话人的特征参数进行倒谱提升之后,MFCC和△MFCC结合能更好地区分不同说话人。 相似文献
2.
3.
文章介绍了语音识别的基本原理以及用DSK6713实现语音识别算法的一些原则和方法,阐述了语音识别在DSP上的实现技术。系统使用梅尔倒谱系数(MFCC)作为特征参数,采用算法相对简单以及计算量较小的动态时间弯折算法(DTW)实现语音参数的匹配。用MATLAB实现DTW算法的仿真,进而将语音识别技术应用到DSP上,实验结果表明对特定人、小词汇量和孤立词的语音识别效果比较好。 相似文献
4.
文章主要介绍了广播电视同步播出监管系统的主要功能、系统的总体框架、各个子系统完成的主要功能以及采用以MFCC(Mel频率倒谱系数)为特征提取算法和隐马尔可夫模型(HMM)为基本语音模型的音频比对的关键技术。 相似文献
5.
以VC++6.0为开发平台,实现一个基于隐马尔可夫模型(Hidden Markov Model,简称HMM)非特定人的安多藏语孤立词语音识别系统。对有声段语音进行MFCC参数的提取,对提取后的MFCC参数进行矢量量化后训练HMM模型,形成特征模板库,最后进行识别。根据安多藏语的特点,改进端点检测的方法,提高了孤立词语音信号检测的准确性,并进一步提高了识别率。 相似文献
6.
《科技通报》2018,(12)
目的:根据听障儿童对汉语塞音塞擦音难掌握情况,为研究和识别其发音,从嗓音起始时间(VOT)和舌运动轨迹入手,提出一种利用语音实验客观研究和识别听障儿童发音的方法。方法:利用电磁发音记录仪(EMA)提取出听障儿童和正常人塞音塞擦音的运动轨迹,通过Praat和Matlab软件提取出VOT、共振峰频率F1、F2以及梅尔倒谱系数(MFCC)参数,对比听障儿童和正常人的VOT和舌运动轨迹,并将提取出的VOT、F1、F2、MFCC和运动轨迹特征值作为识别听障儿童和正常人的组合特征,通过SVM建模识别。结果:VOT结合舌运动轨迹分析更能全面反映听障儿童发音特点,且组合特征对识别正常人与听障儿童有效,SVM的最高识别率达到92.86%。结论:该实验方法可为计算机辅助治疗听障儿童提供依据。 相似文献
7.
8.
9.
为提高噪声环境下语音端点检测的准确性,提出一种基于Mel倒谱距离顺序统计滤波的端点检测算法.该算法首先提取每帧语音信号的Mel频率倒谱系数,以前16帧估算背景噪声,计算每帧语音与背景噪声的倒谱距离;然后将当前帧前后相继若干帧的倒谱距离,经过一组顺序统计滤波器得到加权倒谱距离;最后根据各帧加权倒谱距离对输入语音进行分类.在TIMIT语音库上的实验结果表明,该方法在白噪声、粉噪声、汽车噪声和战斗机噪声等噪声环境下,均能得到理想的端点检测结果,且在低信噪比时依然有效. 相似文献
10.
11.
在语音识别中鲁棒性是一个很关键的因素,文章提出了一种关于0~9数字语音识别算法,采用递归最小二乘法(RLS)来消除噪声,系统使用过零率和能量参数作为端点检测方法,用美尔倒普系数(MFCC)矢量作为声道估计的滤波器,同时,采用动态时间弯折算法来识别语音。结果显示,未加RLS消噪系统前系统的识别率为72%,在处理过程中加入RLS消噪后识别率提高到98.7%。 相似文献
12.
针对一般的语音识别算法均存在抗噪能力不好的问题,无法满足音乐检索系统的需求。针对于此,本文以抗噪能力为基础对MFCC语音识别算法进行了优化,第一步是通过F比方法加权优化了MFCC算法的特征参数,估计出各维特征分量对识别率的影响,并将其提取出来,然后采用主成分分析法对提取的特征分量进行降维处理,以降低计算复杂度,减少数据存储量,加快训练时间,最终提高识别效率。算法仿真结果表明,本文提出的基于抗噪能力优化的MFCC语音识别算法具有较好的抗噪能力,比传统MFCC算法对音乐检索的精确度更高。 相似文献
13.
基音参数检测是对基音周期的估计分析,这在语音信号处理中特别是在语音识别、语音信号的合成、还有编码方面,都起着举足轻重的作用。倒谱法是频域估计法中相对成功的一种方法。本文在结合基于加窗语音的倒谱模型,分析模型的声门激励倒谱和声道脉冲响应倒谱的特点,根据其倒谱特征,改进基音检测算法,并取得良好的效果。 相似文献
14.
15.
针对E-Learning教学系统中存在情感缺失的问题,基于Mel频率倒谱系数和隐马尔可夫模型技术,提出了一种基于语音情感计算的E-Learning教学系统模型,并进行了实验分析。该模型通过采集学习者的语音并进行语音分析,判断和理解其情绪状态,然后根据学习者特定的情绪状态给出相应的情感鼓励或情感补偿,以弥补教学中的情感缺失,实现E-Learning教育中的人性化和个性化,促进语音情感分析在教育中的应用。 相似文献
16.
一种基于改进的LPC参数倒谱分析的说话人识别方法 总被引:2,自引:0,他引:2
线性预测倒谱LPCC在说话人识别中已被广泛使用,文章以LPCC为基础进行Mel变换,得到新的特征参数LPMCC,一次作为说话人识别系统的特征参数,并在识别部分采用VQ和HMM相结合的方法进行建模和识别,实验证明该方法提高了系统的识别率。 相似文献
17.
通过分析语音特征参数的特点和说话人识别的基本方法,以线性预测倒谱系数为特征参数提取算法以及隐马尔可夫模型为建模算法,利用凌阳单片机作硬件平台,实现了声控锁的语音控制功能。实验结果表明,系统性能稳定,识别效果良好。 相似文献
18.
传统固定频谱分配方案对频谱利用率较低,无法满足通信业务量的迅速扩大的需求。提出一种多模盲均衡宽带压缩频谱联合特征识别算法,首先构建多模盲均衡频谱感知网络模型,设计能量检测算法和信道融合准则,构建多模盲均衡宽带压缩频谱联合特征识别模型,基于非线性检验准则,构建判决统计模型。由于上层的频谱感知节点所要传送的信息量越大,通过特征识别,提高固定频谱分配方案对频谱的利用率。仿真实验表明,该算法能有效实现多模盲均衡宽带压缩频谱联合特征识别,提高无线频谱信号的感知和特征识别能力,特征识别的准确率提高,提高固定频谱分配方案对频谱的利用率,仿真实验展示了算法的优越性能。 相似文献
19.
介绍了齿轮箱故障的特点、倒频谱分析的基本原理以及倒频谱分析在齿轮箱故障诊断中的应用.首先,用传统的傅立叶交换法对故障信号进行分析,结果无法有效地提取故障特征;其次,对故障信号进行倒频谱分析,发现能很好地捕获故障信息.实验证明:倒频谱分析在齿轮故障诊断中具有无比的优越性. 相似文献
20.
考虑到对因受地方口音导致的相近、相似、模糊发音的语音的识别困难,本文以易受四川口音(含有特定的声母zh-z/ch-c/sh-s)孤立词语音为识别语音,对其进行声学建模。通过对初始的49维特征参数分三个步骤进行二次特征提取,得到对特定四川口音敏感的特征参数。最后采用矢量量化技术对初始特征参数和通过二次特征提取得到的特征参数进行对比实验。实验表明,经过二次特征提取得到的特征参数有效地改进了易受四川口音(含有特定的声母zh-z/ch-c/sh-s)影响的语音的识别效果,提高了识别率。 相似文献