首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
张旺俏 《中国科技信息》2007,28(7):124-125,127
采用能够反映人对语音的感知特性的Mel频率倒谱系数(MFCC)作为语音的特征参数,研究了基于MFCC的VQ的识别方法,对单独使用MFCC与使用MFCC和AMFCC结合的识别率进行比较,实验结果表明通过对说话人的特征参数进行倒谱提升之后,MFCC和△MFCC结合能更好地区分不同说话人。  相似文献   

2.
说话人识别是当前语音识别的研究热点之一。本文主要研究了以下几个方面:说话人语音识别系统,对能够反映人对语音感知特性的Mel频率倒谱系数(MFCC)作为特征参数进行提取。同时,分析了概率神经网络PNN,概率神经网络是性能良好的分类神经网络。实验结果表明,概率神经网络PNN对训练的语音样本有着很高的分类准确率。  相似文献   

3.
文章介绍了语音识别的基本原理以及用DSK6713实现语音识别算法的一些原则和方法,阐述了语音识别在DSP上的实现技术。系统使用梅尔倒谱系数(MFCC)作为特征参数,采用算法相对简单以及计算量较小的动态时间弯折算法(DTW)实现语音参数的匹配。用MATLAB实现DTW算法的仿真,进而将语音识别技术应用到DSP上,实验结果表明对特定人、小词汇量和孤立词的语音识别效果比较好。  相似文献   

4.
黄艳 《大众科技》2011,(8):22-24
文章主要介绍了广播电视同步播出监管系统的主要功能、系统的总体框架、各个子系统完成的主要功能以及采用以MFCC(Mel频率倒谱系数)为特征提取算法和隐马尔可夫模型(HMM)为基本语音模型的音频比对的关键技术。  相似文献   

5.
以VC++6.0为开发平台,实现一个基于隐马尔可夫模型(Hidden Markov Model,简称HMM)非特定人的安多藏语孤立词语音识别系统。对有声段语音进行MFCC参数的提取,对提取后的MFCC参数进行矢量量化后训练HMM模型,形成特征模板库,最后进行识别。根据安多藏语的特点,改进端点检测的方法,提高了孤立词语音信号检测的准确性,并进一步提高了识别率。  相似文献   

6.
目的:根据听障儿童对汉语塞音塞擦音难掌握情况,为研究和识别其发音,从嗓音起始时间(VOT)和舌运动轨迹入手,提出一种利用语音实验客观研究和识别听障儿童发音的方法。方法:利用电磁发音记录仪(EMA)提取出听障儿童和正常人塞音塞擦音的运动轨迹,通过Praat和Matlab软件提取出VOT、共振峰频率F1、F2以及梅尔倒谱系数(MFCC)参数,对比听障儿童和正常人的VOT和舌运动轨迹,并将提取出的VOT、F1、F2、MFCC和运动轨迹特征值作为识别听障儿童和正常人的组合特征,通过SVM建模识别。结果:VOT结合舌运动轨迹分析更能全面反映听障儿童发音特点,且组合特征对识别正常人与听障儿童有效,SVM的最高识别率达到92.86%。结论:该实验方法可为计算机辅助治疗听障儿童提供依据。  相似文献   

7.
改进MFCC参数在非特定人语音识别中的研究   总被引:1,自引:0,他引:1  
随着信息时代的高速发展,人们越来越关注计算机的便携使用方式,以语音输入代替手动输入成为计算机未来发展的一个必然趋势.本文在MFCC特征参数的基础上,提出了一种改进MFCC特征参数--BMFCC特征参数,以提高原MFCC特征参数在语音识别时的识别率和运算速度.BMFCC特征参数在进行参数的提取时,分为特征分量加权、特征分量求差分、主成分分析三个步骤.仿真实验结果表明,本文提出的BMFCC特征参数在识别率和有运算速度上均优于MFCC特征参数,且更具鲁棒性.  相似文献   

8.
本系统是基于AD公司的Blackfin-533开发平台,通过提取语音信号的美尔倒谱系数(MFCC),并在此基础上采用动态时间调整的DTW算法将提取的语音参数与已有的参敷模板匹配,实现指定文本语音识别功能.系统充分利用Blackfin 533芯片高速并行的数据处理能力,大约能够在330ms内达到与10个样本模板匹配,同时通过软硬件结合的去噪技术与阈值的准确设定使识别的准确率大大提高.  相似文献   

9.
为提高噪声环境下语音端点检测的准确性,提出一种基于Mel倒谱距离顺序统计滤波的端点检测算法.该算法首先提取每帧语音信号的Mel频率倒谱系数,以前16帧估算背景噪声,计算每帧语音与背景噪声的倒谱距离;然后将当前帧前后相继若干帧的倒谱距离,经过一组顺序统计滤波器得到加权倒谱距离;最后根据各帧加权倒谱距离对输入语音进行分类.在TIMIT语音库上的实验结果表明,该方法在白噪声、粉噪声、汽车噪声和战斗机噪声等噪声环境下,均能得到理想的端点检测结果,且在低信噪比时依然有效.  相似文献   

10.
MFCC特征参数提取是语音识别设计中非常重要的环节,MFCC特征参数提取的实现及参数的精确度对于最终语音识别的准确度有着非常大的影响。对于MFCC特征参数的提取主要的方法是利用MATLAB软件来实现。利用Labview软件调用MATLAB程序可将两者的优点综合起来,提高软件的适用性。  相似文献   

11.
在语音识别中鲁棒性是一个很关键的因素,文章提出了一种关于0~9数字语音识别算法,采用递归最小二乘法(RLS)来消除噪声,系统使用过零率和能量参数作为端点检测方法,用美尔倒普系数(MFCC)矢量作为声道估计的滤波器,同时,采用动态时间弯折算法来识别语音。结果显示,未加RLS消噪系统前系统的识别率为72%,在处理过程中加入RLS消噪后识别率提高到98.7%。  相似文献   

12.
针对一般的语音识别算法均存在抗噪能力不好的问题,无法满足音乐检索系统的需求。针对于此,本文以抗噪能力为基础对MFCC语音识别算法进行了优化,第一步是通过F比方法加权优化了MFCC算法的特征参数,估计出各维特征分量对识别率的影响,并将其提取出来,然后采用主成分分析法对提取的特征分量进行降维处理,以降低计算复杂度,减少数据存储量,加快训练时间,最终提高识别效率。算法仿真结果表明,本文提出的基于抗噪能力优化的MFCC语音识别算法具有较好的抗噪能力,比传统MFCC算法对音乐检索的精确度更高。  相似文献   

13.
基音参数检测是对基音周期的估计分析,这在语音信号处理中特别是在语音识别、语音信号的合成、还有编码方面,都起着举足轻重的作用。倒谱法是频域估计法中相对成功的一种方法。本文在结合基于加窗语音的倒谱模型,分析模型的声门激励倒谱和声道脉冲响应倒谱的特点,根据其倒谱特征,改进基音检测算法,并取得良好的效果。  相似文献   

14.
为了得到更具区分性的特征参数,采用改进的MFCC提取方法,即低方差性的多窗谱估计MFCC,并在其基础上引入了短时TEO能量和ΔMFCC动态特征参量组合特征进行说话人识别。由于直接将两者进行组合会造成维度过高,计算复杂度增加,为此提出了相关距离Fisher比来对特征参数进行加权和维度筛选,最后送入GMM-UBM分类器模型进行识别。实验表明,改进的混合特征参数相较于单一的特征参量,具备更好的识别能力,使得识别率有一定程度的提高。  相似文献   

15.
针对E-Learning教学系统中存在情感缺失的问题,基于Mel频率倒谱系数和隐马尔可夫模型技术,提出了一种基于语音情感计算的E-Learning教学系统模型,并进行了实验分析。该模型通过采集学习者的语音并进行语音分析,判断和理解其情绪状态,然后根据学习者特定的情绪状态给出相应的情感鼓励或情感补偿,以弥补教学中的情感缺失,实现E-Learning教育中的人性化和个性化,促进语音情感分析在教育中的应用。  相似文献   

16.
一种基于改进的LPC参数倒谱分析的说话人识别方法   总被引:2,自引:0,他引:2  
王婧  朱黎 《大众科技》2008,(8):28-29
线性预测倒谱LPCC在说话人识别中已被广泛使用,文章以LPCC为基础进行Mel变换,得到新的特征参数LPMCC,一次作为说话人识别系统的特征参数,并在识别部分采用VQ和HMM相结合的方法进行建模和识别,实验证明该方法提高了系统的识别率。  相似文献   

17.
徐春辉 《科技广场》2007,(5):208-210
通过分析语音特征参数的特点和说话人识别的基本方法,以线性预测倒谱系数为特征参数提取算法以及隐马尔可夫模型为建模算法,利用凌阳单片机作硬件平台,实现了声控锁的语音控制功能。实验结果表明,系统性能稳定,识别效果良好。  相似文献   

18.
传统固定频谱分配方案对频谱利用率较低,无法满足通信业务量的迅速扩大的需求。提出一种多模盲均衡宽带压缩频谱联合特征识别算法,首先构建多模盲均衡频谱感知网络模型,设计能量检测算法和信道融合准则,构建多模盲均衡宽带压缩频谱联合特征识别模型,基于非线性检验准则,构建判决统计模型。由于上层的频谱感知节点所要传送的信息量越大,通过特征识别,提高固定频谱分配方案对频谱的利用率。仿真实验表明,该算法能有效实现多模盲均衡宽带压缩频谱联合特征识别,提高无线频谱信号的感知和特征识别能力,特征识别的准确率提高,提高固定频谱分配方案对频谱的利用率,仿真实验展示了算法的优越性能。  相似文献   

19.
介绍了齿轮箱故障的特点、倒频谱分析的基本原理以及倒频谱分析在齿轮箱故障诊断中的应用.首先,用传统的傅立叶交换法对故障信号进行分析,结果无法有效地提取故障特征;其次,对故障信号进行倒频谱分析,发现能很好地捕获故障信息.实验证明:倒频谱分析在齿轮故障诊断中具有无比的优越性.  相似文献   

20.
考虑到对因受地方口音导致的相近、相似、模糊发音的语音的识别困难,本文以易受四川口音(含有特定的声母zh-z/ch-c/sh-s)孤立词语音为识别语音,对其进行声学建模。通过对初始的49维特征参数分三个步骤进行二次特征提取,得到对特定四川口音敏感的特征参数。最后采用矢量量化技术对初始特征参数和通过二次特征提取得到的特征参数进行对比实验。实验表明,经过二次特征提取得到的特征参数有效地改进了易受四川口音(含有特定的声母zh-z/ch-c/sh-s)影响的语音的识别效果,提高了识别率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号