首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 953 毫秒
1.
针对各种连续数字语音信号,实现了一种基于TMS320C5x评价模块(EVM)和定点数字信号处理器ADSP2181的与特定人无关的连续数字语音识别系统。在分析了连续概率密度的隐马尔可夫模型(CDHMM)基础上,利用LPC倒谱系数、LPC差分倒谱系数、能量归一化系数及其差分系数作为语音特征矢量,训练和识别采用Viterbi算法和Baum-Welch重估算法,并利用ADSP2181实现语音识别的算法。有效地提高了系统的识别率。给出了实现各个阶段所需的时间,比较了不同语音特征参数对识别率的影响。在具体实现中,着重处理了抗噪、定点实时实现及连续数字串识别人的身份等问题。实验结果表明,本系统在普通环境下取得较满意的效果,正确识别率达到93.2%,为其实用化提供了较为重要的技术途径。  相似文献   

2.
在特定人孤立词语音识别中,最为简单有效的方法是采用动态时间弯折(dynamic time warping,DTW)算法。该算法基于动态规划(DP)的思想,解决了发音长短不一的模板匹配问题,是语音识别中很成功的一种匹配算法。  相似文献   

3.
基于CHMM的高性能连续数字语音识别算法   总被引:3,自引:0,他引:3  
介绍了一种基于连续隐马尔可夫模型(CHMM)的汉语连续数字语音识别算法,该识别算法以MEL频率倒谱系数(MFCC)为主要语音特征参数,采用切割-识别方案。在此框架下,本文提出了变时窗的连续数字切割算法,并且结合了声调信息,因此最终连续数字语音识别率达到了90%以上。  相似文献   

4.
建立了一个基于HMM算法的非特定人语音识别系统,阐述了具体实现过程,包括预处理、特征参数的提取及模板的匹配.并用MATLAB6.5对整个系统进行了仿真,仿真结果表明该系统可实现对非特定人输入命令词的识别,识别率约为88.6%.  相似文献   

5.
提取语音信号的MFCC特征参数,用矢量量化(VQ)的LBG算法来建立匹配模板.在MATLAB软件平台上,基于GUI界面实现说话人识别系统软件设计,并通过实验验证其有效性.  相似文献   

6.
声纹识别技术,形象的说法就是说话人识别技术。它是根据人在说话时产生的波形,以及波形中反映人类心理和生理的特征参数来判断说话人的身份的技术。本文所研究的是与文本有关的说话人确认系统。比较了基于声道的线性预测倒谱系数(LPCC)和基于听觉特性的MEL频率倒谱系数(MFCC)参数特征,得出MFCC对环境存在更高的鲁棒性。并运用了隐形马尔可夫模型(HMM)在MATLAB上实现了语音数字的识别仿真。本实验系统的识别率达到了90%,验证了HMM模型识别的准确性。  相似文献   

7.
基于LPC预测残差的倒谱基音检测算法分析   总被引:1,自引:0,他引:1  
给出了加窗语音的新倒谱模型,提出了基于语音LPC预测残差的倒谱基音周期检测算法(LP—CEP法),该算法在倒谱计算中采取高频分量置零的新措施,仿真研究结果表明,该算法相对于传统倒谱基音检测算法(CEP法),无论是对不同的干净语音还是对不同信噪比的含噪语音,其基音检测结果有明显的改善。  相似文献   

8.
研究表明,对一种识别有利的信息有可能反而对其他识别任务造成干扰,表情识别需要利用表示各种表情之间差异的信息.针对特定人及非特定人的7种基本表情.提出基于二维主元分析(Two-Dimensional Principle Analysis,2DPCA)补空间的表情识别算法.基于CED-WYU(1.0)及JAFFE两个表情数据库的实验结果表明,2DPCA补空间算法针对特定人与非特定人的表情识别率可达100%,高于2DPCA算法.  相似文献   

9.
研究并提取了2种重要的语音特征参数,包括能有效表征语音全极点模型的线性预测倒谱系数和模拟人耳对不同频率声音感知特性不同的美尔倒谱系数(MFCC),对这2个参数进行了分析和比较。在预处理中分析比较了矩形窗和汉明窗。在建模的过程中,采用最小距离分类器的识别策略。  相似文献   

10.
说话人识别是语音识别的一种特殊方式,其目的不是识别语音内容,而是识别说话人是谁,即从语音信号中提取个人特征。采用矢量量化(VQ)可避免困难的语音分段问题和时间归整问题,且作为一种数据压缩手段可大大减少系统所需的数据存储量。本文提出了识别特征选取采用复倒谱特征参数和对应用VQ的说话人识别系统改进的一种方法。当用于训练的数据量较小时,复倒谱特征可以得到比较稳定的识别性能。VQ的改进方法避免了说话人识别系统的训练时间与使用时间相差过长从而导致系统的性能明显下降以及若利用自相关函数带来的大量运算。  相似文献   

11.
语音识别技术及应用   总被引:5,自引:0,他引:5  
语音识别技术近年来得到了飞速的发展并且在越来越多的领域得到了广泛的应用。隐马尔可夫模型(HMM)语音识别技术是一种基于训练数据提供的概率自动构造识别系统的技术,主要用于大量词汇的语音识别,而且具有良好的识别性能和抗噪性能。因此,一般的语音识别系统都采用基于HMM的识别方法作为其基本算法。本文列举了语音识别在教学中的应用示例来分析其基本算法。  相似文献   

12.
Matlab人工神经网络工具箱中的BP工具函数及其应用   总被引:1,自引:0,他引:1  
人工神经网络中的BP网络模型在函数逼近、模式识别等领域得到了广泛的应用 ,但利用神经网络解决实际问题时 ,经常涉及到大量的数值计算问题 ,而运用计算机高级语言编程对神经网络BP模型进行仿真和辅助设计是件十分麻烦的事情 ,为了解决这个矛盾 ,Matlab工具箱中专门编制了大量有关设计BP网络模型的工具函数 .本文分析了Matlab软件包中人工神经网络工具箱的有关BP网络的工具函数 ,并给出了部分重要工具函数的实际应用  相似文献   

13.
汉语语音识别中连续大词汇量的语音识别率较差。若能把连续大词汇量的语音进行实时自动切分为单个音节,便可提高系统的识别率。如何做到对语音识别中音节的自动切分,首先需找出汉语语音音节的特征。本文综合了当前对汉语音节特征的研究成果,通过深入地比较分析,系统地给出了汉语语音音节的功率谱特征和时域特征,为汉语语音音节的自动切分提供算法依据,对提高连续大词汇量语音的识别率有重要意义。  相似文献   

14.
黏着性语音的元辅音区别性特征对口语环境下的连续语音识别影响很大。通过维吾尔语和谐语音现象下的发音规律及其规则,采用语言学、实验语音学技术和数字语音信号处理等方法,研究和谐发音现象下的元音、辅音区别特征系统,建立扩展元辅音集,并以此为基础,开展基于扩展元辅音集的连续语音识别研究,进一步通过其声学模型比较研究,构建连续语音识别模型,为维吾尔语口语环境下的连续语音识别提供一种新方法。  相似文献   

15.
由于传统人机交互大多使用键盘、鼠标等交互方式,速度较慢,因此语音识别开始受到越来越多人的青睐。但语音识别也存在如扩展性太差、可复制性不好造成单个产品价格过高、过于依赖外部条件导致对自身使用有所限制等问题。设计并实现一种基于本地的语音识别系统,通过构建抽象语法树,实现语音控制操作。实验结果表明,该系统的离线识别准确率可达70%以上,可以在局域网内实现语音操作。  相似文献   

16.
本文提出了一种基于模糊方向线索特征 (fuzzydirectionallineelementfeature,FDLEF)与人工神经网络 (artificialneuralnetworks,ANN)相结合的手写体汉字识别方法 (FDLEF -ANN) ,解决了单一FDLEF方法对相似字识别率低的问题 .这种方法分两级识别 ,先由FDLEF识别模块进行识别 ,将识别结果送至选择器 ,若识别结果不属于预定义的相似字集合簇 ,则该结果即为最终识别结果 ,否则 ,将其送至人工神经网络识别模块进行相似字的识别 .本方法既保留了原FDLEF方法的优点又提高了对相似字的识别率 ,FDLEF -ANN系统对相似字的识别率由 78 0 9%提高到 82 97% .  相似文献   

17.
基于韵律变换的情感说话人识别   总被引:1,自引:0,他引:1  
为了解决由情感变化引起的说话人识别性能下降问题,提出了一种新的情感说话人识别系统.首先,通过引入情感识别作为前端处理模块,对中性语音和情感语音进行分类.然后,对情感语音进行韵律修正,分别采用高斯归一化、高斯混合模型(GMM)和支持向量回归(SVR)等方法建立情感语音和中性语音的基频映射规则,并根据平均线性变化率对时长进行了修正.最后,对韵律修正后的情感语音进行识别.实验结果表明,提出的情感说话人识别系统可以有效地提高情感说话人识别的性能,识别率相比传统方法有了显著的提高.并且通过基频和时长修正的情感语音更接近于中性语音.  相似文献   

18.
黄浩  朱杰 《东南大学学报》2007,23(2):174-178
提出了2种解决汉语语音识别中声调问题的方法:利用区分性方法对基于隐马尔可夫模型(HMM)的声调模型进行训练;提出将区分性训练的声调模型加入大词汇量连续语音识别系统的最优方法,该方法根据最小音子错误的训练准则以及利用扩展Baum-Welch算法区分性训练与模型相关的概率权重,对声学模型以及声调模型概率进行加权.实验结果表明区分性训练的声调模型能够显著地提高连续语音声调识别率以及大词汇量语音识别系统的识别率,同时区分性的模型权重训练能够在区分性声调模型加入连续语音识别系统之后进一步提高系统的识别性能.  相似文献   

19.
基于语音识别的汉语发音自动评分系统的初步设计   总被引:2,自引:0,他引:2  
语音识别技术的发展使得人与计算机的交互成为可能,文章结合了语音识别的相关技术,提出了在对外汉语教学领域中,对汉语自动发音水平评价系统的设计,详细地介绍了系统的结构以及所使用的关键技术。  相似文献   

20.
利用小波变换对含噪语音信号进行特征提取,结合隐马尔可夫和人工神经网络混合模型进行识别的方法,进一步反映语音信号的动态特性、增强抗干扰能力、提高识别率.实验证明,该模型适合于对噪声背景下的语音进行识别,同传统的HMM模型相比,具有更好的抗噪鲁棒性,在信噪比较低情况下,识别率比传统的HMM模型有明显提高.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号