首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
提取语音信号的MFCC特征参数,用矢量量化(VQ)的LBG算法来建立匹配模板.在MATLAB软件平台上,基于GUI界面实现说话人识别系统软件设计,并通过实验验证其有效性.  相似文献   

2.
说话人识别系统是在语音信号中提取说话人信息来鉴别说话人身份.整个系统以DSP处理器为核心结构,进行训练和识别语音信号.采用LPC和DTW作为核心算法来进行说话人识别.  相似文献   

3.
以DSP实现基于概率DP匹配算法的说话人识别系统   总被引:1,自引:0,他引:1  
提出了利用概率DP匹配算法进行说话人识别的的设想。并给出了运用TMS320C5416实现说话人自动识别系统的方案。该系统利用一种新的语音信号r阶的倒谱线性回归系数等参数构成识别的特征矢量集,运用提出的概率DP匹配算法进行与文本无关的说话人识别。实验结果表明该系统具有识别精度高、识别速度快,占用系统资源少等特点,是一种有效的说话人自动识别的实现方法。  相似文献   

4.
基于韵律变换的情感说话人识别   总被引:1,自引:0,他引:1  
为了解决由情感变化引起的说话人识别性能下降问题,提出了一种新的情感说话人识别系统.首先,通过引入情感识别作为前端处理模块,对中性语音和情感语音进行分类.然后,对情感语音进行韵律修正,分别采用高斯归一化、高斯混合模型(GMM)和支持向量回归(SVR)等方法建立情感语音和中性语音的基频映射规则,并根据平均线性变化率对时长进行了修正.最后,对韵律修正后的情感语音进行识别.实验结果表明,提出的情感说话人识别系统可以有效地提高情感说话人识别的性能,识别率相比传统方法有了显著的提高.并且通过基频和时长修正的情感语音更接近于中性语音.  相似文献   

5.
借助语音增强、基音频率分析和共振峰分析,设计了简单的说话人识别系统.在识别过程中以平均基音频率、共振峰峰值位置作为两种评价标准,交互印证,最终实现了说话人的身份辨认.  相似文献   

6.
说话人识别可以看作语音识别的一种,本文研究了MFCC参数的提取方法,并对矢量量化VQ的识别模型进行了讨论,设计出了一种可行的识别方法,通过验证,这种方法对于文本有关的说话人识别,可达到较高的识别率.  相似文献   

7.
基于Matlab设计了以动态时间规整(dynamic time warping,DTW)算法和Mel频率倒谱系数(Mel frequency cepstrum coefficients,MFCC)参数提取算法为基础的孤立词自动语音识别系统;然后结合机器人语音识别的需求,基于凌阳SPCE061A设计了语音识别应用系统。结合上述两部分工作,设计、实现了机器人语音识别系统演示实验和机器人语音识别半开放实验,实现效果达到预期实验设计目标。  相似文献   

8.
说话人识别是语音识别的一种特殊方式,其目的不是识别语音内容,而是识别说话人是谁,即从语音信号中提取个人特征。采用矢量量化(VQ)可避免困难的语音分段问题和时间归整问题,且作为一种数据压缩手段可大大减少系统所需的数据存储量。本文提出了识别特征选取采用复倒谱特征参数和对应用VQ的说话人识别系统改进的一种方法。当用于训练的数据量较小时,复倒谱特征可以得到比较稳定的识别性能。VQ的改进方法避免了说话人识别系统的训练时间与使用时间相差过长从而导致系统的性能明显下降以及若利用自相关函数带来的大量运算。  相似文献   

9.
当今人工智能发展迅速,语音识别成为人机交互的重要方式。为提高语音识别准确度,在分析语音信号前去除语音信号噪声干扰并提高语音信号能量尤为重要。在实际应用中,不同语音信号包含不同的噪声。针对不同的语音噪声,在传统谱减法基础上,通过判断算法窗函数,根据不同的噪声能量改变多窗谱减法的过减因子参数,以增强算法自适应能力。仿真结果表明,在低信噪比情况下,通过改变过减因子值,可取得一个最优过减因子值以改进谱减法下的音乐噪声和失真度。自适应多窗谱减法改进后与基本谱减法相比,信噪比提高了 29%;与多窗谱减法相比,信噪比提高了 16%。该自适应多窗谱减法可适应不同噪声环境下的语音信号,增强语音信号中的关键信息并减少噪声干扰。  相似文献   

10.
言语过滤识别   总被引:1,自引:0,他引:1  
本文提出了一种新型的说话人识别方法——言语过滤识别。有别于传统的说话人识剐方法的是,言语过滤识别方法分为四步:(1)提问式问答;(2)语义校验;(3)语料过滤;(4)声纹比对。言语过滤识剐方法通过语音识别方法部分过滤了复杂背景的影响,提高了说话人识别的性能。此外,言语过滤识别在辩认“活体声纹”方面有先天性的优势.通过合理设计提问问题和时问题答案的校验,可有效防止冒用者:  相似文献   

11.
基于选定的频率普通话发音识别技术,由定义的输入普通话语音拾取的普通话语音识别腔共振曲线,通过对中文分词、韵母声母频谱识别,对中文语音的声母、韵母、声调集成、输出的中文拼音词序列组合,形成句子的中文拼音序列。通过韵母分析方法进行单音节,频域幅频特性分析技术,不需要学习或培训事先要用于一个特定的人的声音,能够识别非特定的单词和句子的普通话语音,采用速率自适应梳状(Discrete Fourier Transform,DFT)谱分析算法,只需极少量的计算,就能够确定地包含4个声调的普通话,具有响应速度快,所需存储空间小,能方便的移植到嵌入式设备的应用程序中。  相似文献   

12.
声纹识别技术,形象的说法就是说话人识别技术。它是根据人在说话时产生的波形,以及波形中反映人类心理和生理的特征参数来判断说话人的身份的技术。本文所研究的是与文本有关的说话人确认系统。比较了基于声道的线性预测倒谱系数(LPCC)和基于听觉特性的MEL频率倒谱系数(MFCC)参数特征,得出MFCC对环境存在更高的鲁棒性。并运用了隐形马尔可夫模型(HMM)在MATLAB上实现了语音数字的识别仿真。本实验系统的识别率达到了90%,验证了HMM模型识别的准确性。  相似文献   

13.
语音交互系统以“说话”的方式来使用计算机,实现真正意义上的人机对话。本详细阐述了语音交互界面的结构和主要实现技术,如语义框架集合,语音识别/合成功能的实现。  相似文献   

14.
由于传统人机交互大多使用键盘、鼠标等交互方式,速度较慢,因此语音识别开始受到越来越多人的青睐。但语音识别也存在如扩展性太差、可复制性不好造成单个产品价格过高、过于依赖外部条件导致对自身使用有所限制等问题。设计并实现一种基于本地的语音识别系统,通过构建抽象语法树,实现语音控制操作。实验结果表明,该系统的离线识别准确率可达70%以上,可以在局域网内实现语音操作。  相似文献   

15.
朝鲜语是我国目前适用范围较为广泛、使用人口较多的一种少数民族语言。朝鲜语紧急呼叫号码的语音识别软件,采用语音命令来呼叫号码,能够准确识别拨叫号码,在特定场合可以起到至关重要的作用。将语音控制指令范围设定为报警求助、火警等词汇的识别中,实现了朝鲜语紧急呼叫号码语音识别系统的软件算法部分。通过对信号处理的每个步骤和朝鲜语数字连读问题进行深入分析及研究,选择DTW(动态时间弯曲)算法作为该软件的核心算法。Matlab实验结果表明,采用的语音识别过程及算法可以准确地对录制的朝鲜语紧急呼叫号码进行识别。  相似文献   

16.
开发了一套基于语音控制的机械臂3D虚拟操作的仿真实验平台。平台设计采用LabVIEW的3D仿真模块和Microsoft的语音识别引擎,解决机械臂对象的3D建模、运动显示算法和语音识别控制等核心问题。其中3D对象建模用LabVIEW三维图片工具完成,运动显示控制算法采用循环内嵌事件的主体结构,依靠.NET节点调用语音识别引擎实现语音指令。  相似文献   

17.
周君  刘璟 《教育技术导刊》2018,17(11):13-16
为了使服务机器人在酒店管理中发挥更大作用,节省酒店成本,基于运行Android系统的友善之臂Tiny4412平台,设计了一款面向酒店服务机器人的错误率低、实时性高的语音交互系统,系统包括人脸检测、语音合成、语义理解和语法识别等部分。通过移植OpenCV库到Android系统中,利用OpenCV库中AdaBoost算法实现实时人脸检测;通过网络连接科大讯飞的讯飞开放平台获得海量语音资源,实现语音交互系统的语音识别、语义理解和语法识别功能;通过Tiny4412串口向下位机传输数据,实现对下位机运动控制。实践测试表明,系统可以检测到酒店客人到来、回答客人关于酒店的基本问题、完成基本引领工作,使机器人提供更好的服务。  相似文献   

18.
针对各种连续数字语音信号,实现了一种基于TMS320C5x评价模块(EVM)和定点数字信号处理器ADSP2181的与特定人无关的连续数字语音识别系统。在分析了连续概率密度的隐马尔可夫模型(CDHMM)基础上,利用LPC倒谱系数、LPC差分倒谱系数、能量归一化系数及其差分系数作为语音特征矢量,训练和识别采用Viterbi算法和Baum-Welch重估算法,并利用ADSP2181实现语音识别的算法。有效地提高了系统的识别率。给出了实现各个阶段所需的时间,比较了不同语音特征参数对识别率的影响。在具体实现中,着重处理了抗噪、定点实时实现及连续数字串识别人的身份等问题。实验结果表明,本系统在普通环境下取得较满意的效果,正确识别率达到93.2%,为其实用化提供了较为重要的技术途径。  相似文献   

19.
针对目前市场上语音控制家居产品的语音识别必须在服务端进行,在缺乏互联网情况下则无法使用,以及智能家居设备采用有线组网方式导致升级维护成本高的问题,设计一款采用WiFi、蓝牙等无线混合组网技术搭建的异构家庭网关,可以动态添加设备,组网灵活方便且成本低,即使在断网情况下,网关也可自动切换到本地语音识别。为此,使用基于上下文相关的GMM-HMM算法训练声学模型与语言模型搭建语音识别引擎,采用BP神经网络学习算法实现语音智能控制。测试结果表明,系统功能基本符合预期,在断网情况下系统仍可以进行语音识别并对家庭设备进行语音控制。  相似文献   

20.
该文设计了基于高斯混合模型的说话人识别系统实验,通过录制小型语音库、提取表征说话人个性的特征参数、训练说话人模型和似然度判决,实现文本无关的说话人识别.实验以小组形式协作完成,并鼓励学生展开进阶研究,帮助学生提升团队协作精神和创新精神,以及解决复杂工程问题的能力.所建立的全过程多维度立体化的实验考核体系,着眼于对学生的...  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号