共查询到20条相似文献,搜索用时 46 毫秒
1.
提取语音信号的MFCC特征参数,用矢量量化(VQ)的LBG算法来建立匹配模板.在MATLAB软件平台上,基于GUI界面实现说话人识别系统软件设计,并通过实验验证其有效性. 相似文献
2.
说话人识别系统是在语音信号中提取说话人信息来鉴别说话人身份.整个系统以DSP处理器为核心结构,进行训练和识别语音信号.采用LPC和DTW作为核心算法来进行说话人识别. 相似文献
3.
以DSP实现基于概率DP匹配算法的说话人识别系统 总被引:1,自引:0,他引:1
提出了利用概率DP匹配算法进行说话人识别的的设想。并给出了运用TMS320C5416实现说话人自动识别系统的方案。该系统利用一种新的语音信号r阶的倒谱线性回归系数等参数构成识别的特征矢量集,运用提出的概率DP匹配算法进行与文本无关的说话人识别。实验结果表明该系统具有识别精度高、识别速度快,占用系统资源少等特点,是一种有效的说话人自动识别的实现方法。 相似文献
4.
基于韵律变换的情感说话人识别 总被引:1,自引:0,他引:1
为了解决由情感变化引起的说话人识别性能下降问题,提出了一种新的情感说话人识别系统.首先,通过引入情感识别作为前端处理模块,对中性语音和情感语音进行分类.然后,对情感语音进行韵律修正,分别采用高斯归一化、高斯混合模型(GMM)和支持向量回归(SVR)等方法建立情感语音和中性语音的基频映射规则,并根据平均线性变化率对时长进行了修正.最后,对韵律修正后的情感语音进行识别.实验结果表明,提出的情感说话人识别系统可以有效地提高情感说话人识别的性能,识别率相比传统方法有了显著的提高.并且通过基频和时长修正的情感语音更接近于中性语音. 相似文献
5.
6.
说话人识别可以看作语音识别的一种,本文研究了MFCC参数的提取方法,并对矢量量化VQ的识别模型进行了讨论,设计出了一种可行的识别方法,通过验证,这种方法对于文本有关的说话人识别,可达到较高的识别率. 相似文献
7.
8.
说话人识别是语音识别的一种特殊方式,其目的不是识别语音内容,而是识别说话人是谁,即从语音信号中提取个人特征。采用矢量量化(VQ)可避免困难的语音分段问题和时间归整问题,且作为一种数据压缩手段可大大减少系统所需的数据存储量。本文提出了识别特征选取采用复倒谱特征参数和对应用VQ的说话人识别系统改进的一种方法。当用于训练的数据量较小时,复倒谱特征可以得到比较稳定的识别性能。VQ的改进方法避免了说话人识别系统的训练时间与使用时间相差过长从而导致系统的性能明显下降以及若利用自相关函数带来的大量运算。 相似文献
9.
当今人工智能发展迅速,语音识别成为人机交互的重要方式。为提高语音识别准确度,在分析语音信号前去除语音信号噪声干扰并提高语音信号能量尤为重要。在实际应用中,不同语音信号包含不同的噪声。针对不同的语音噪声,在传统谱减法基础上,通过判断算法窗函数,根据不同的噪声能量改变多窗谱减法的过减因子参数,以增强算法自适应能力。仿真结果表明,在低信噪比情况下,通过改变过减因子值,可取得一个最优过减因子值以改进谱减法下的音乐噪声和失真度。自适应多窗谱减法改进后与基本谱减法相比,信噪比提高了 29%;与多窗谱减法相比,信噪比提高了 16%。该自适应多窗谱减法可适应不同噪声环境下的语音信号,增强语音信号中的关键信息并减少噪声干扰。 相似文献
10.
11.
《实验室研究与探索》2017,(6):128-132
基于选定的频率普通话发音识别技术,由定义的输入普通话语音拾取的普通话语音识别腔共振曲线,通过对中文分词、韵母声母频谱识别,对中文语音的声母、韵母、声调集成、输出的中文拼音词序列组合,形成句子的中文拼音序列。通过韵母分析方法进行单音节,频域幅频特性分析技术,不需要学习或培训事先要用于一个特定的人的声音,能够识别非特定的单词和句子的普通话语音,采用速率自适应梳状(Discrete Fourier Transform,DFT)谱分析算法,只需极少量的计算,就能够确定地包含4个声调的普通话,具有响应速度快,所需存储空间小,能方便的移植到嵌入式设备的应用程序中。 相似文献
12.
13.
易定 《深圳职业技术学院学报》2005,4(1):31-34
语音交互系统以“说话”的方式来使用计算机,实现真正意义上的人机对话。本详细阐述了语音交互界面的结构和主要实现技术,如语义框架集合,语音识别/合成功能的实现。 相似文献
14.
15.
朝鲜语是我国目前适用范围较为广泛、使用人口较多的一种少数民族语言。朝鲜语紧急呼叫号码的语音识别软件,采用语音命令来呼叫号码,能够准确识别拨叫号码,在特定场合可以起到至关重要的作用。将语音控制指令范围设定为报警求助、火警等词汇的识别中,实现了朝鲜语紧急呼叫号码语音识别系统的软件算法部分。通过对信号处理的每个步骤和朝鲜语数字连读问题进行深入分析及研究,选择DTW(动态时间弯曲)算法作为该软件的核心算法。Matlab实验结果表明,采用的语音识别过程及算法可以准确地对录制的朝鲜语紧急呼叫号码进行识别。 相似文献
16.
17.
为了使服务机器人在酒店管理中发挥更大作用,节省酒店成本,基于运行Android系统的友善之臂Tiny4412平台,设计了一款面向酒店服务机器人的错误率低、实时性高的语音交互系统,系统包括人脸检测、语音合成、语义理解和语法识别等部分。通过移植OpenCV库到Android系统中,利用OpenCV库中AdaBoost算法实现实时人脸检测;通过网络连接科大讯飞的讯飞开放平台获得海量语音资源,实现语音交互系统的语音识别、语义理解和语法识别功能;通过Tiny4412串口向下位机传输数据,实现对下位机运动控制。实践测试表明,系统可以检测到酒店客人到来、回答客人关于酒店的基本问题、完成基本引领工作,使机器人提供更好的服务。 相似文献
18.
针对各种连续数字语音信号,实现了一种基于TMS320C5x评价模块(EVM)和定点数字信号处理器ADSP2181的与特定人无关的连续数字语音识别系统。在分析了连续概率密度的隐马尔可夫模型(CDHMM)基础上,利用LPC倒谱系数、LPC差分倒谱系数、能量归一化系数及其差分系数作为语音特征矢量,训练和识别采用Viterbi算法和Baum-Welch重估算法,并利用ADSP2181实现语音识别的算法。有效地提高了系统的识别率。给出了实现各个阶段所需的时间,比较了不同语音特征参数对识别率的影响。在具体实现中,着重处理了抗噪、定点实时实现及连续数字串识别人的身份等问题。实验结果表明,本系统在普通环境下取得较满意的效果,正确识别率达到93.2%,为其实用化提供了较为重要的技术途径。 相似文献
19.
针对目前市场上语音控制家居产品的语音识别必须在服务端进行,在缺乏互联网情况下则无法使用,以及智能家居设备采用有线组网方式导致升级维护成本高的问题,设计一款采用WiFi、蓝牙等无线混合组网技术搭建的异构家庭网关,可以动态添加设备,组网灵活方便且成本低,即使在断网情况下,网关也可自动切换到本地语音识别。为此,使用基于上下文相关的GMM-HMM算法训练声学模型与语言模型搭建语音识别引擎,采用BP神经网络学习算法实现语音智能控制。测试结果表明,系统功能基本符合预期,在断网情况下系统仍可以进行语音识别并对家庭设备进行语音控制。 相似文献