首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 95 毫秒
1.
语音情感识别本质上是对语音情感的特征参数进行分类和模式识别,其核心问题在于寻找一个更为合适的语音情感识别算法.综述了语音情感识别算法的分类概况、常用的分类算法、研究中的困难与需要进一步研究的问题.最后展望了可能提高精度的先进识别模型.  相似文献   

2.
研究了基于认知评估原理的多维耳语音情感识别.首先,比较了耳语音情感数据库和数据采集方法,研究了耳语音情感表达的特点,特别是基本情感的表达特点.其次,分析了耳语音的情感特征,并通过近年来的文献总结相关阶特征在效价维和唤醒维上的特征.研究了效价维和唤醒维在区分耳语音情感中的作用.最后,研究情感识别算法和应用耳语音情感识别的高斯混合模型.认知能力的评估也融入到情感识别过程中,从而对耳语音情感识别的结果进行纠错.基于认知分数,可以提高情感识别的结果.实验结果表明,耳语音信号中共振峰特征与唤醒维度不显著相关,而短期能量特征与情感变化在唤醒维度相关.结合认知分数可以提高语音情感识别的结果.  相似文献   

3.
为了有效识别自发、非典型及未分割语音的情感以建立更自然的人机交互界面,提出了一种新的结合情感数据场和蚁群策略的语音情感识别算法.用情感数据场中势函数建立基于块的声学特征向量之间的内在联系.为识别自发语音情感,用人工蚁群模拟基于块的声学特征向量,然后用典型的蚁群策略研究每个人工蚂蚁在情感数据场的运动轨迹,并把该蚂蚁的运动轨迹作为对应的声学特征向量的情感标签.利用2012年连续音视频情感挑战赛中的语音数据对所提算法进行测试.实验结果表明:该算法较已有算法能更好地对基于块的语音情感进行识别.  相似文献   

4.
为了在语音情感识别中获得高效、紧凑的低维特征,提出了一种新的基于不确定线性判别分析的特征约简方法.用与传统LDA相同的原则,在最大判别方向的估计中引入带噪声或失真输入数据的不确定性.在维吾尔语语音情感识别任务上验证了不确定性判别分析的有效性.在该情感数据上,分析了维吾尔语的语音情感特征,着重对维吾尔语语音的基音频率和共振峰频率进行了详细分析.利用不确定性线性判别分析对特征维数进行了降维研究,获得了比其他的常用降维技术更好的结果.通过不确定性线性判别分析获得的低维数据供给支持向量机,实现了维吾尔语的语音情感识别.实验结果表明,采用适当的不确定性估计算法时,在维吾尔语音情感识别任务上,不确定性线性判别分析(ULDA)算法优于传统LDA降维算法.  相似文献   

5.
为了准确地识别语音情感信息,研究了语音情感识别的降维中判别级联效应.基于现有的局部投影算法和图形嵌入理论,提出了一种新型判别分析算法,即DCLPP算法.为了能够对语音情感识别保持足够的信息,该算法利用嵌入图形为样本的内部特点保留了原始空间.然后,为了扩展映射形式,提出了一种kernel dCLPP(KDCLPP)的方法.在EM O-DB和eNTERFACE'05情感语音数据库上对该算法进行了验证,结果表明,所提算法可明显地超越现有的常用主成成分分析(PCA)、线性判别分析(LDA)、局部保持投影(LPP)、局部鉴别嵌入(LDE)和图优化的Fisher判别分析(Gb FA)等判别分析算法,这些算法都有不同类型的分类器.  相似文献   

6.
随着情感计算成为人工智能的一个重要发展方向,语音情感识别作为情感计算的一个重要组成部分,受到了广泛关注。从情感描述模型、语音情感特征、语音情感库、语音情感挑战赛这4个方面对语音情感研究现状进行总结,并给出目前语音情感识别技术存在的挑战,以及相应的研究方法。  相似文献   

7.
传统语音情感识别算法模型结构较为简单,需要足够量级的训练数据才能使其具有一定的实用性.然而,在实际应用中可供训练的数据集较少.为解决上述问题,提出了一种语音情感深度迁移识别算法.通过属性分析表构建、特征提取、相关性计算等操作确定源域数据集,并在此基础上训练迁移学习并构建预训练模型,最终构成语音情感分类模型.实验结果表明...  相似文献   

8.
语音情感识别与分析是目前人工智能、情感计算的主要研究方向之一,其研究成果能直接影响人与计算机的交互方式。语音情感识别的基础是语音情感特征值的确定、提取及分析,这将直接决定语音情感识别的准确程度。情感语音数据库的创建及选择成为语音情感特征值提取与分析的前提。本文实验所采用的情感语音库为北京航空航天大学电子信息工程学院毛峡教授课程组建立的,对于不同情感的同一样本语句进行能量分析、基频分析及共振峰分析,以确定不同特征值对于喜悦、愤怒、悲伤、平静等情感的区别度。这为进一步研究人类情感语音特征值的确定与提取、分析提供了一定的参考。  相似文献   

9.
针对老年人的语音情感识别问题,提出一种基于语谱图的老年人语音情感识别方法。首先采用一种改进的基于先验信噪比的维纳滤波算法,针对老人语音情感库EESDB进行语音增强,选取合适的语音情感库,对语音进行语谱图特征提取与规范化,然后分析卷积神经网络(CNN)的结构并选定Cifar10网络对语谱图进行分类,最后采用3种方案进行对比实验。实验结果取得了较高的情感识别率,表明了该方法的有效性和可行性。  相似文献   

10.
针对非特定人的孤立词识别问题,研究构造了基于神经网络建模的语音识别算法。该算法的意义在于将神经网络应用于非特定人语音识别中,并取得了较好的识别效果,表明了神经网络在语音识别中的优势。  相似文献   

11.
基于二维情感空间的语音情感识别   总被引:1,自引:0,他引:1  
为提高语音情感的正确识别率,在利用反映"激发维"维度信息的韵律特征基础上,提出了采用反映"评价维"维度信息的音质特征作为新的情感特征使用。再将韵律特征参数和音质特征参数结合并用于语音情感识别,并采用支持向量机分类器实现对汉语生气、高兴、悲伤、厌烦和中性五类情感的识别。试验结果表明,基于"激发维"和"评价维"二维情感空间取得的情感总体平均正确识别率为84%,比基于"激发维"一维情感空间取得的识别率高出了12%。可见同时考虑从"激发维"和"评价维"二维情感空间进行语音情感识别,识别结果得到了较大改善。  相似文献   

12.
为了提高语音情感识别的准确度,探讨了将Transformer应用于语音情感识别的可能性.将对数梅尔尺度谱图及其一阶差分特征相融合作为输入,使用Transformer来提取分层语音表示,分析注意头个数和Transformer编码器层数的变化对识别精度的影响.结果表明,在ABC、CASIA、DES、EMODB和IEMOCAP语音情感数据库上,相比以MFCC为特征的Transformer,所提模型的精度分别提高了13.98%、8.14%、24.34%、8.16%和20.9%.该模型表现优于递归神经网络(RNN)、卷积神经网络(CNN)、Transformer等其他模型.  相似文献   

13.
基于韵律变换的情感说话人识别   总被引:1,自引:0,他引:1  
为了解决由情感变化引起的说话人识别性能下降问题,提出了一种新的情感说话人识别系统.首先,通过引入情感识别作为前端处理模块,对中性语音和情感语音进行分类.然后,对情感语音进行韵律修正,分别采用高斯归一化、高斯混合模型(GMM)和支持向量回归(SVR)等方法建立情感语音和中性语音的基频映射规则,并根据平均线性变化率对时长进行了修正.最后,对韵律修正后的情感语音进行识别.实验结果表明,提出的情感说话人识别系统可以有效地提高情感说话人识别的性能,识别率相比传统方法有了显著的提高.并且通过基频和时长修正的情感语音更接近于中性语音.  相似文献   

14.
将基于多个嵌入图组合形式的半监督判别分析(SDA)以及核SDA(KSDA)应用于全监督的语音情感识别.在语音信号样本情感成分的预处理阶段,从样本语段中提取出多种特征及其统计参数,包括基音、过零率、能量、持续长度、共振峰和MFCC(Mel频率倒谱系数).在将样本特征送入分类器之前的维数约简阶段,使用经过参数优化的SDA或KSDA进行降维.Berlin语音情感数据库上的实验表明,在使用多类SVM分类器时的全监督语音情感识别中,SDA优于其他一些先进的基于谱图学习的维数约简算法,如LDA,LPP,MFA等,而KSDA通过核化的数据映射,能够取得比上述所有算法更好的识别效果.  相似文献   

15.
基于支持向量机的语音情感识别   总被引:6,自引:0,他引:6  
针对语音情感识别特征识别问题,本利用支持向量机进行了研究.分析表明语音信号的情感特征参数在输入空间中不完全是一个线性分类的问题,使用非线性的核函数对输入空间进行映射可以有效地提高识别效率.与已有的多模式语音情感识别方式相比,利用高斯(径向基)核函数的支持向量机的识别效果优于其他已有的方法.  相似文献   

16.
朝鲜语是我国目前适用范围较为广泛、使用人口较多的一种少数民族语言。朝鲜语紧急呼叫号码的语音识别软件,采用语音命令来呼叫号码,能够准确识别拨叫号码,在特定场合可以起到至关重要的作用。将语音控制指令范围设定为报警求助、火警等词汇的识别中,实现了朝鲜语紧急呼叫号码语音识别系统的软件算法部分。通过对信号处理的每个步骤和朝鲜语数字连读问题进行深入分析及研究,选择DTW(动态时间弯曲)算法作为该软件的核心算法。Matlab实验结果表明,采用的语音识别过程及算法可以准确地对录制的朝鲜语紧急呼叫号码进行识别。  相似文献   

17.
张石清 《现代教育技术》2009,19(Z1):224-225
为了解决目前e-Learning教学系统中的情感交流匮乏问题,提出一种新的基于语音情感识别技术的e-Learning系统模型。语音作为人类最重要的交流媒介之一,不仅携带着大量的文字符号信息,还包含了人类丰富的情感信息。利用语音情感识别技术获取和识别学习者的学习情感状态,从而实现e-Learning教学系统的智能化和人性化。本文对该系统的关键技术作了详细阐述。  相似文献   

18.
从语音识别系统前端信号处理出发研究了语音信号特征的提取方法.对4种语音识别主流算法模型进行部署,构建了不同车载应用场景,并选择字错误率和实时率两种主流评价指标对算法模型进行了效果测试,开展了算法评价与分析,同时运用开源二维网格搜索法优化了百度DeepSpeech2模型,并对其进行硬件适配,使得模型识别精度、识别速率得到...  相似文献   

19.
首先对DTW算法进行了研究和分析,针对其计算量大和抗干扰差的弱点,分别提出了路径约束的DTW算法和放宽起始点的DTW算法。通过实验验证,使用改进后的DTW方法能够提高其识别速度和降低噪声对语音识别的干扰,提高语音识别率。  相似文献   

20.
为了检测工作人员的烦躁情绪,实现情感状态的评价,通过在工作环境中诱发情感语音,获取了足够的测试样本,建立了2000条样本的工作环境情感语音数据库.在检测烦躁情绪过程中,首先提取语音的韵律特征和音质特征参数,然后利用基于蛙跳算法的改进的BP神经网络进行烦躁情绪识别.实验比较了BP,RBF和sFLA神经网络的性能,结果显示SFLA神经网络的识别率比BP神经网络高4.7%,比RBF神经网络高4.3%.实验结果表明,使用蛙跳算法训练随机初始数据可以优化神经网络的连接权重和阈值,加快收敛速度,提高识别率.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号