首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 515 毫秒
1.
为了在语音情感识别中获得高效、紧凑的低维特征,提出了一种新的基于不确定线性判别分析的特征约简方法.用与传统LDA相同的原则,在最大判别方向的估计中引入带噪声或失真输入数据的不确定性.在维吾尔语语音情感识别任务上验证了不确定性判别分析的有效性.在该情感数据上,分析了维吾尔语的语音情感特征,着重对维吾尔语语音的基音频率和共振峰频率进行了详细分析.利用不确定性线性判别分析对特征维数进行了降维研究,获得了比其他的常用降维技术更好的结果.通过不确定性线性判别分析获得的低维数据供给支持向量机,实现了维吾尔语的语音情感识别.实验结果表明,采用适当的不确定性估计算法时,在维吾尔语音情感识别任务上,不确定性线性判别分析(ULDA)算法优于传统LDA降维算法.  相似文献   

2.
为了有效识别自发、非典型及未分割语音的情感以建立更自然的人机交互界面,提出了一种新的结合情感数据场和蚁群策略的语音情感识别算法.用情感数据场中势函数建立基于块的声学特征向量之间的内在联系.为识别自发语音情感,用人工蚁群模拟基于块的声学特征向量,然后用典型的蚁群策略研究每个人工蚂蚁在情感数据场的运动轨迹,并把该蚂蚁的运动轨迹作为对应的声学特征向量的情感标签.利用2012年连续音视频情感挑战赛中的语音数据对所提算法进行测试.实验结果表明:该算法较已有算法能更好地对基于块的语音情感进行识别.  相似文献   

3.
将基于多个嵌入图组合形式的半监督判别分析(SDA)以及核SDA(KSDA)应用于全监督的语音情感识别.在语音信号样本情感成分的预处理阶段,从样本语段中提取出多种特征及其统计参数,包括基音、过零率、能量、持续长度、共振峰和MFCC(Mel频率倒谱系数).在将样本特征送入分类器之前的维数约简阶段,使用经过参数优化的SDA或KSDA进行降维.Berlin语音情感数据库上的实验表明,在使用多类SVM分类器时的全监督语音情感识别中,SDA优于其他一些先进的基于谱图学习的维数约简算法,如LDA,LPP,MFA等,而KSDA通过核化的数据映射,能够取得比上述所有算法更好的识别效果.  相似文献   

4.
在二维局部保持投影中引入类间结构信息和类标签,得到有监督的二维判别局部保持投影算法,从而提高了特征集的鉴别性。针对算法中参数的选取问题,建立无参数权重矩阵,提出无参数的二维判别局部保持投影(无参数2D-DLPP)算法。在Yale和ORL人脸库上的仿真实验结果表明,该算法与二维判别局部保持投影(2D-DLPP)、二维局部保持投影法(2D-LPP)和二维线性判别分析法(2D-LDA)相比能够取得更高的识别率。  相似文献   

5.
张石清 《现代教育技术》2009,19(Z1):224-225
为了解决目前e-Learning教学系统中的情感交流匮乏问题,提出一种新的基于语音情感识别技术的e-Learning系统模型。语音作为人类最重要的交流媒介之一,不仅携带着大量的文字符号信息,还包含了人类丰富的情感信息。利用语音情感识别技术获取和识别学习者的学习情感状态,从而实现e-Learning教学系统的智能化和人性化。本文对该系统的关键技术作了详细阐述。  相似文献   

6.
通过对图、完全图和正则图概念的介绍,详细地描述了图嵌入的方法,同时对主成分分析、线性鉴别分析、局部保持投影、保持近邻嵌入、L1图及其嵌入等经典的特征提取算法进行了详细的代数推导,列出了详细的推导过程,得出这些经典算法可以用图嵌入理论来解释的结论,最后得出特征提取算法的核心在于算法的图构造.  相似文献   

7.
单次脑电分类实验中,采用基于logistic回归的正则化方法来提高分类准确率.首先,提出一种新算法——局部保持投影稀疏logistic回归,将局部保持投影正则项加入到稀疏logistic回归中.该算法旨在保留原始特征空间邻域信息的同时保证结果的稀疏性.然后,利用边界优化法和逐分量迭代算法在训练集上求解权重向量,克服了牛顿-拉夫森法和迭代重加权最小二乘法的局限性.最后,在自步调手指运动数据集上采用十重交叉验证法得到80%的分类准确率,并与稀疏logistic回归的实验结果进行对比,说明局部保持投影正则项有效地保留了对脑电分类有用的信息.  相似文献   

8.
基于CHMM的高性能连续数字语音识别算法   总被引:3,自引:0,他引:3  
介绍了一种基于连续隐马尔可夫模型(CHMM)的汉语连续数字语音识别算法,该识别算法以MEL频率倒谱系数(MFCC)为主要语音特征参数,采用切割-识别方案。在此框架下,本文提出了变时窗的连续数字切割算法,并且结合了声调信息,因此最终连续数字语音识别率达到了90%以上。  相似文献   

9.
针对老年人的语音情感识别问题,提出一种基于语谱图的老年人语音情感识别方法。首先采用一种改进的基于先验信噪比的维纳滤波算法,针对老人语音情感库EESDB进行语音增强,选取合适的语音情感库,对语音进行语谱图特征提取与规范化,然后分析卷积神经网络(CNN)的结构并选定Cifar10网络对语谱图进行分类,最后采用3种方案进行对比实验。实验结果取得了较高的情感识别率,表明了该方法的有效性和可行性。  相似文献   

10.
语音情感识别本质上是对语音情感的特征参数进行分类和模式识别,其核心问题在于寻找一个更为合适的语音情感识别算法.综述了语音情感识别算法的分类概况、常用的分类算法、研究中的困难与需要进一步研究的问题.最后展望了可能提高精度的先进识别模型.  相似文献   

11.
提出了一种基于级联投影的高斯混合模型算法.首先,针对不同的特征维度计算高斯混合模型的边缘概率,依据边缘概率模型构造出多个子分类器,每个子分类器包含不同的特征组合.采用级联结构的框架对子分类器进行动态融合,从而获得对样本的自适应能力.其次,在心电情感信号和语音情感信号上验证了算法的有效性,通过实验诱发手段,采集了烦躁、喜悦、悲伤等情感数据.最后,探讨了情感特征参数(心率变异性、心电混沌特征,语句级静态特征等)的提取方法.研究了情感特征的降维方法,包括主分量分析、顺序特征选择、Fisher区分度和最大信息系数等方法.实验结果显示,所提算法能够在2种不同的场景中有效地提高情感识别的准确率.  相似文献   

12.
传统语音情感识别算法模型结构较为简单,需要足够量级的训练数据才能使其具有一定的实用性.然而,在实际应用中可供训练的数据集较少.为解决上述问题,提出了一种语音情感深度迁移识别算法.通过属性分析表构建、特征提取、相关性计算等操作确定源域数据集,并在此基础上训练迁移学习并构建预训练模型,最终构成语音情感分类模型.实验结果表明...  相似文献   

13.
为了提高语音情感识别的准确度,探讨了将Transformer应用于语音情感识别的可能性.将对数梅尔尺度谱图及其一阶差分特征相融合作为输入,使用Transformer来提取分层语音表示,分析注意头个数和Transformer编码器层数的变化对识别精度的影响.结果表明,在ABC、CASIA、DES、EMODB和IEMOCAP语音情感数据库上,相比以MFCC为特征的Transformer,所提模型的精度分别提高了13.98%、8.14%、24.34%、8.16%和20.9%.该模型表现优于递归神经网络(RNN)、卷积神经网络(CNN)、Transformer等其他模型.  相似文献   

14.
针对数据隐藏算法嵌入容量有限的问题,提出一种新的插值方法,将其应用到数据隐藏领域中,并给出一种基于改进插值的可逆数据隐藏算法.该算法在信息嵌入时,先用文中提出的插值方法对原始宿主图像进行扩展,扩展时,每个扩展像素以4个宿主像素点作为参考,通过计算得出均值,再将其分配到待扩展的位置上,信息嵌入后可以无损地进行信息提取和图像的恢复.实验结果表明,该数据隐藏算法在嵌入容量、图像视觉质量方面均取得很好的效果,相比其他的数据隐藏算法,最大嵌入容量提高了24.78%-39.29%,最大藏量下的信噪比均保持在39 dB以上.  相似文献   

15.
鉴于Transformer模型在自然语言处理等序列任务中的优异性能,提出了一种适用于语音情感识别任务的改进的类Transformer模型.为了减小Transformer模型中多头注意力单元内部由softmax运算引起的巨大时间消耗与内存开销,提出了一种新的线性自注意力计算方法,通过使用泰勒级数展开公式代替原来的指数函数,并根据矩阵乘积的关联性将softmax运算相对于输入序列长度的时间复杂度和空间复杂度从O(N~2)降至O(N),其中N为序列长度.在2个不同语言的情感语料库上进行实验.结果表明:所提出的线性注意力算法可获得与原始缩放点积注意力相近的性能,而模型训练过程中的时间和内存开销大幅降低;与原始的Transformer模型相比,改进后的模型具有更鲁棒的语音情感识别性能.  相似文献   

16.
提出了一种新的基于核判别分析的手写汉字识别方法。核判别是对线性判别式分析的非线性判别分布的扩展。阐述了核判别分析法的基本原理,建立了核判别分析手写体识别模型,研究分析了核判别分析手写体识别模型的缺陷并提出了优化策略。在此基础上,采用C#与核判别分析相结合的算法,更好地展示了核判别算法的算法优势,采用高级语言提高了网络的学习训练速度和识别效果。  相似文献   

17.
基于韵律变换的情感说话人识别   总被引:1,自引:0,他引:1  
为了解决由情感变化引起的说话人识别性能下降问题,提出了一种新的情感说话人识别系统.首先,通过引入情感识别作为前端处理模块,对中性语音和情感语音进行分类.然后,对情感语音进行韵律修正,分别采用高斯归一化、高斯混合模型(GMM)和支持向量回归(SVR)等方法建立情感语音和中性语音的基频映射规则,并根据平均线性变化率对时长进行了修正.最后,对韵律修正后的情感语音进行识别.实验结果表明,提出的情感说话人识别系统可以有效地提高情感说话人识别的性能,识别率相比传统方法有了显著的提高.并且通过基频和时长修正的情感语音更接近于中性语音.  相似文献   

18.
研究了基于认知评估原理的多维耳语音情感识别.首先,比较了耳语音情感数据库和数据采集方法,研究了耳语音情感表达的特点,特别是基本情感的表达特点.其次,分析了耳语音的情感特征,并通过近年来的文献总结相关阶特征在效价维和唤醒维上的特征.研究了效价维和唤醒维在区分耳语音情感中的作用.最后,研究情感识别算法和应用耳语音情感识别的高斯混合模型.认知能力的评估也融入到情感识别过程中,从而对耳语音情感识别的结果进行纠错.基于认知分数,可以提高情感识别的结果.实验结果表明,耳语音信号中共振峰特征与唤醒维度不显著相关,而短期能量特征与情感变化在唤醒维度相关.结合认知分数可以提高语音情感识别的结果.  相似文献   

19.
在与人交互情况下,针对物体识别系统通过反馈信息自动优化识别能力问题,提出一种结合梯度直方图(HOG)特征提取和支持向量机(SVM)进行特定物体识别的方法。运用Tensorflow训练语音识别模型反馈人机交互信息,使系统实现自优化。以手表类别作为识别对象,通过HOG特征描述对手表进行特征提取,通过二维主成分分析(2DPCA)和线性判别分析(LDA)对整体和局部特征进行降维,运用改进的空间金字塔匹配模型通过SVM对其分类,并运用非极大值抑制(NMS)确定区域,运用训练的梅尔倒谱(MFCC)特征语音识别模型对反馈信息进行识别,最终整合信息优化识别系统。实验表明,该系统对手表有较高的识别率,并能通过人机交流在较短时间内使系统实现自优化。  相似文献   

20.
为进一步提高维吾尔语方言识别准确率,从特征域出发提出基于小波包变换的方言语音声学参数提取算法,利用小波包变换对语音信号进行精细分解,使用Bark滤波器提取低频子带和高频子带系数与人耳基底膜的不同部分对应,用局部线性嵌入的流形学习算法进行降维,提升信号的分类性能。分别以i-vector和x-vector两个主流系统进行方言识别实验,结果表明,小波特征声学参数的方言识别准确率比MFCC特征和FBank特征识别准确率均有提高。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号