首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 376 毫秒
1.
基于改进的DTW算法的仿真与分析   总被引:2,自引:0,他引:2  
传统的DTW算法着重于时间规整和间距测量的概念,对数据的可靠性没有进行有效的分析,且对连续词的识别效果不明显。基于松弛起始点和分段思想的改进DTW算法,可以改善明阿算法的缺陷。通过对语音样本0.9在MATLAB6.5上的仿真实现与分析表明,采用改进后的DTW算法具有良好的语音识别效果。  相似文献   

2.
在特定人孤立词语音识别中,最为简单有效的方法是采用动态时间弯折(dynamic time warping,DTW)算法。该算法基于动态规划(DP)的思想,解决了发音长短不一的模板匹配问题,是语音识别中很成功的一种匹配算法。  相似文献   

3.
基于Matlab设计了以动态时间规整(dynamic time warping,DTW)算法和Mel频率倒谱系数(Mel frequency cepstrum coefficients,MFCC)参数提取算法为基础的孤立词自动语音识别系统;然后结合机器人语音识别的需求,基于凌阳SPCE061A设计了语音识别应用系统。结合上述两部分工作,设计、实现了机器人语音识别系统演示实验和机器人语音识别半开放实验,实现效果达到预期实验设计目标。  相似文献   

4.
朝鲜语是我国目前适用范围较为广泛、使用人口较多的一种少数民族语言。朝鲜语紧急呼叫号码的语音识别软件,采用语音命令来呼叫号码,能够准确识别拨叫号码,在特定场合可以起到至关重要的作用。将语音控制指令范围设定为报警求助、火警等词汇的识别中,实现了朝鲜语紧急呼叫号码语音识别系统的软件算法部分。通过对信号处理的每个步骤和朝鲜语数字连读问题进行深入分析及研究,选择DTW(动态时间弯曲)算法作为该软件的核心算法。Matlab实验结果表明,采用的语音识别过程及算法可以准确地对录制的朝鲜语紧急呼叫号码进行识别。  相似文献   

5.
说话人识别系统是在语音信号中提取说话人信息来鉴别说话人身份.整个系统以DSP处理器为核心结构,进行训练和识别语音信号.采用LPC和DTW作为核心算法来进行说话人识别.  相似文献   

6.
语音情感识别本质上是对语音情感的特征参数进行分类和模式识别,其核心问题在于寻找一个更为合适的语音情感识别算法.综述了语音情感识别算法的分类概况、常用的分类算法、研究中的困难与需要进一步研究的问题.最后展望了可能提高精度的先进识别模型.  相似文献   

7.
提出了一种基于小波变换和动态时间规整算法相结合的故障识别算法。该算法首先利用小波变换对实验样本与参考样本进行处理以去掉样本信号的非平稳性和噪声,然后利用动态时间规整算法对未知的实验样本与参考样本之间的相似性进行评价,并基于最短距离进行分类,以达到故障识别的目的,最后将此算法应用到Tennessee Eastman过程的故障识别中,仿真结果表明基于小波变换和DTW算法能够准确地识别出发生何种故障,而常规的DTW算法则存在一定的失误。  相似文献   

8.
在VC++环境下,提取PLAR特征参数,基于听觉特性和语谱特性的语音增强器作为预处理器,对语音信号首先进行降噪处理,建立了基于DTW的抗噪声说话人识别系统.实验结果表明,即使在信噪比比较低的情况下,该系统都会在一定程度上提高多种噪声环境下说话人识别系统的识别性能.  相似文献   

9.
首先,采用传统的DTW(Dynamic Time Warping,动态时间弯折)算法,计算积累距离矩阵,求得最佳匹配路径所对应的匹配距离;然后,将最后的匹配分数用min函数找到最小值对应的模板;最后,返回对应的模板代码。在此基础上,还探讨并提出了进一步提高识别率的方法和提高系统效率的高效算法,即放宽端点的DTW算法,并进行了一定量的实验。使识别效果达到更好。  相似文献   

10.
语音信号处理实验教学研究探索   总被引:1,自引:0,他引:1  
针对语音信号处理课程实验教学的难点,以MATLAB软件作为平台,设计开发实验教学辅助软件,包括时域分析、频域分析、线性预测基音检测、语音编码、语音识别(DTW和HMM)、语音增强等知识,给学生以直观的认识,加快理解过程,增强学生解决问题的能力。  相似文献   

11.
语音识别技术及应用   总被引:5,自引:0,他引:5  
语音识别技术近年来得到了飞速的发展并且在越来越多的领域得到了广泛的应用。隐马尔可夫模型(HMM)语音识别技术是一种基于训练数据提供的概率自动构造识别系统的技术,主要用于大量词汇的语音识别,而且具有良好的识别性能和抗噪性能。因此,一般的语音识别系统都采用基于HMM的识别方法作为其基本算法。本文列举了语音识别在教学中的应用示例来分析其基本算法。  相似文献   

12.
从语音识别系统前端信号处理出发研究了语音信号特征的提取方法.对4种语音识别主流算法模型进行部署,构建了不同车载应用场景,并选择字错误率和实时率两种主流评价指标对算法模型进行了效果测试,开展了算法评价与分析,同时运用开源二维网格搜索法优化了百度DeepSpeech2模型,并对其进行硬件适配,使得模型识别精度、识别速率得到...  相似文献   

13.
汉语语音识别中连续大词汇量的语音识别率较差.若能把连续大词汇量的语音进行实时自动切分为单个音节,便可提高系统的识别率.如何做到对语音识别中音节的自动切分,首先需找出汉语语音音节的特征.本文综合了当前对汉语音节特征的研究成果,通过深入地比较分析,系统地给出了汉语语音音节的功率谱特征和时域特征,为汉语语音音节的自动切分提供算法依据,对提高连续大词汇量语音的识别率有重要意义.  相似文献   

14.
随着科技的迅速发展,人机交互越来越受到人们的重视,语音情感识别更是学术界研究的热点。将BP神经网络算法用于语音情感识别研究,并在汉语情感数据集上进行了相关实验,识别的准确率达到了91.5%,相较于SVM算法分类精度提高了5%。  相似文献   

15.
手势识别是一种多维空间应用,而传统DTW算法只能解决一维问题,对其进行拓展,演化为不同维度运用,得到一种全新基于改进的新型算法DTW-IMP,它能计算两个N维时间序列之间的距离。以欧氏距离为元素组成矩阵,根据Bellman最优化原理得到最优规整路径,结合预先录入的手势模版,实现动态手势识别。  相似文献   

16.
针对非特定人的孤立词识别问题,研究构造了基于神经网络建模的语音识别算法。该算法的意义在于将神经网络应用于非特定人语音识别中,并取得了较好的识别效果,表明了神经网络在语音识别中的优势。  相似文献   

17.
汉语语音识别中连续大词汇量的语音识别率较差。若能把连续大词汇量的语音进行实时自动切分为单个音节,便可提高系统的识别率。如何做到对语音识别中音节的自动切分,首先需找出汉语语音音节的特征。本文综合了当前对汉语音节特征的研究成果,通过深入地比较分析,系统地给出了汉语语音音节的功率谱特征和时域特征,为汉语语音音节的自动切分提供算法依据,对提高连续大词汇量语音的识别率有重要意义。  相似文献   

18.
针对各种连续数字语音信号,实现了一种基于TMS320C5x评价模块(EVM)和定点数字信号处理器ADSP2181的与特定人无关的连续数字语音识别系统。在分析了连续概率密度的隐马尔可夫模型(CDHMM)基础上,利用LPC倒谱系数、LPC差分倒谱系数、能量归一化系数及其差分系数作为语音特征矢量,训练和识别采用Viterbi算法和Baum-Welch重估算法,并利用ADSP2181实现语音识别的算法。有效地提高了系统的识别率。给出了实现各个阶段所需的时间,比较了不同语音特征参数对识别率的影响。在具体实现中,着重处理了抗噪、定点实时实现及连续数字串识别人的身份等问题。实验结果表明,本系统在普通环境下取得较满意的效果,正确识别率达到93.2%,为其实用化提供了较为重要的技术途径。  相似文献   

19.
在语音识别中,噪声严重影响语音特征提取,使得正确率明显下降。针对这一情况,提出了子带加权平均语音识别算法(Sub—Band Weighted Average Speech Recogrution,SBWASR),在噪声环境下,该方法能有效地提高语音识别的准确性。最后通过实验验证特定条件下该方法是正确有效的。  相似文献   

20.
研究了基于认知评估原理的多维耳语音情感识别.首先,比较了耳语音情感数据库和数据采集方法,研究了耳语音情感表达的特点,特别是基本情感的表达特点.其次,分析了耳语音的情感特征,并通过近年来的文献总结相关阶特征在效价维和唤醒维上的特征.研究了效价维和唤醒维在区分耳语音情感中的作用.最后,研究情感识别算法和应用耳语音情感识别的高斯混合模型.认知能力的评估也融入到情感识别过程中,从而对耳语音情感识别的结果进行纠错.基于认知分数,可以提高情感识别的结果.实验结果表明,耳语音信号中共振峰特征与唤醒维度不显著相关,而短期能量特征与情感变化在唤醒维度相关.结合认知分数可以提高语音情感识别的结果.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号